2023 年,AI 开发者生态跃动非凡!继 ChatGPT 引爆全球热议后,开发者们马不停蹄地逐梦 AGI,勇闯模型深海,解锁多维技能。从企业巨头至初创团队,纷纷投身这场智能革命,“卷爆了”模型参数。下面将公布 2023 年的 AI 开发者生态报告,让我们一起看看 AI 工程师的角色是如何从单一的技术执行者转变为涵盖跨学科知识的战略合作伙伴。
本文收录于《新程序员007:大模型时代的开发者》。《新程序员 007》聚焦开发者成长,其间既有图灵奖得主 Joseph Sifakis、前 OpenAI 科学家 Joel Lehman 等高瞻远瞩,又有对于开发者们至关重要的成长路径、工程实践及趟坑经验等,欢迎大家。
作者 | 王启隆
责编 | 唐小引
出品 | CSDN(ID:CSDNnews)
打开 VS Code,发现 GitHub Copilot 的下载量已经突破了 1,300 万大关。在 2024 年的今天,许多开发者对代码生成工具已经不再迷茫,进入了各执己见的阶段:有些人快速入局并提高了任务效率,有些人批评这种工具降低了代码质量和可维护性,还有些人尚在暗处中默默观察吃瓜。
随着 OpenAI 凭借一支囊括了众多本科生的年轻团队打出了“王炸” Sora,很多圈外人意识到这些 AIGC 工具不仅是开发者的事情,还能影响每一个人的未来生活;而不少圈内人也纷纷开始摩拳擦掌,准备迎接 2024 年到来的人工智能技术剧变。
为了让广大开发者更好地掌握人工智能时代下全新范式的变迁,CSDN、《新程序员》从多个角度入手,精心编纂了一份《AI 开发者生态报告》。我们不仅详尽梳理了人工智能发展历程,还紧密结合了诸如 ChatGPT 等标志性事件推出后带来的技术进步与行业动态,并在文末附赠一张《人工智能产业全景图》,为读者全方位展现当今 AI 开发生态系统的格局与活力。
无论你身处于这场浪潮的哪一处位置,希望这份生态报告都能为你答疑解惑,点亮眼前的路途。
亮点总结
通过观察生态报告中的数据,我们提炼了以下亮点:
人才济济的 AI 行业:本科从业者超过五成,硕博占比达到 36%
AI 市场「五年计划」:从 1,288 亿美元增长到 4,263 亿美元
2022 年,全球人工智能 IT 总投资规模为 1,288 亿美元,这个数字在 2023 年预计增长至 1560 亿美元,最终在 2027 年预计增至 4,236 亿美元,五年复合增长率(CAGR)约为 26.9%。到 2027 年,中国 AI 投资规模有望达到 381 亿美元,全球占比约 9%(见图 1)。
图 1 中国人工智能市场支出预测
近年来,我国人工智能产业不断提升自身智能化水平,向高质量发展迈进:
未来五年内,AI 硬件将继续成为主要的 IT 投入方向,而 AI 软件市场则以快速增长的速度占据技术市场的领先地位,规模逼近百亿元人民币;同时,通信、银行、政企和制造业在 AI 服务市场的投入潜力巨大。
AI 的黄金时代:形成了完整的工程技术栈与应用开发工程
人工智能技术历经从基础算法如支持向量机、长短时记忆网络(LSTM)、深度学习的蓬勃发展,再到知识图谱、生成对抗网络(GAN)、Transformer以及大语言模型等领域前沿技术的深度挖掘,人工智能技术不仅拓宽了应用场景,也极大地提升了功能表现。尽管如此,在技术的实际应用旅程中,同样暴露出了集成复杂度高、性能波动难以掌控、协同机制尚不成熟等一系列亟待解决的问题。
当前,在工程技术栈领域,已构建起了一套层次分明的架构体系(见图 2)。自下而上涵盖了“云基础设施+高性能硬件”的基石,支撑着从底层模型训练、模型推理、高效部署直至顶层应用开发与实际落地的全过程。
图 2 人工智能工程技术栈
而在应用开发工程实践上,则观察到了从早期的手动编程逐步过渡到基于提示技术(Prompt Engineering)、智能代理(Agent)设计,甚至发展至能自动构建多智能体系统的 AutoAgent 框架(见图 3)。现阶段,此类工程均在技术和商业层面承受着重大挑战,特别是在近期的热门话题——Agent 的研究中,“成本效益比”始终是一个核心焦点。期待未来能在确保效能提升的同时降低成本,从而推动 Agent 真正成为撬动新一轮人工智能革命的关键力量。
图 3 人工智能应用开发工程演进
AI 就业潮:95.88% 的岗位要求应聘者拥有本科以上学历!
目前 AI 领域对开发者有两大要求:经验丰富,学历高。
在 AI 从业者中,87.93% 拥有本科及以上的学历,该比例在新经济行业中位列第一(见图 4)。其中,本科学历的从业人员占比超过了五成, 硕士和博士学历的从业人员占比达到 36.06%。
图 4 行业从业者学历背景统计
当前,AI 领域开发者受教育程度遥遥领先,硕博占近四成(见图 5)。2023 年 1 ~ 8 月,新发布的人工智能岗位中,有 42.19% 的岗位要求具有 5 年以上的经验。而高达 95.88% 的岗位要求应聘者拥有本科以上学历,要求硕士或博士以上学历的岗位占比达到 44.17%。
图 5 岗位的经验要求和学历要求统计
开发范式大革命:自然语言交互是众望所归
人+ AI 协作编程,形成新开发范式
根据 CSDN 对用户的年龄与学历分布的调研(见图 6),新生代开发者的基础学历相比以前进一步提升:18 ~ 22 岁开发者,达到本科率 68.63%;这个数据相比 41 ~ 50 岁开发者的本科率提升了 11.1%。
图 6 调研用户年龄与学历分布
这些开发者是否顺应了时代潮流,成为了“新程序员”呢?统计结果显示(见图 7),近 90% 的开发者已经在使用代码生成工具,其中 35% 的开发者每天都要使用,36% 认为代码生成工具极大地提高了开发效率。
AI 已经成为了许多开发者编程范式中不可缺少的一部分,是协同工作的伙伴。
图 7 代码生成工具使用频率域满意度
代码生成工具百花齐放
那么,代码生成工具中最火的是 Copilot 吗?
事实上,ChatGPT 不仅是流行度最高的大模型服务,也是最受欢迎的代码生成工具,使用率断层领先其他工具(见图 8)。可以见得,哪怕对于开发者来说,这种通用、操作便捷的工具仍然更加“亲民”一些,但最重要的原因,可能是它更适合价格敏感性消费者——ChatGPT 免费、Copilot 付费。
图 8 代码生成工具产品选型
当然,微软的 GitHub Copilot、亚马逊的 Amazon CodeWhisperer 依旧不可小觑,在统计中取得了第二和第三的成绩。国内产品中,CodeGeeX、aiXcoder、iFlyCode、CodeArts Snap 也受到开发者们的选用。
值得一提的是,图表中的灰色部分排名第六,这意味着仍有相当一部分开发者未使用代码生成工具。
代码生成工具的流行意味着开发者的编程范式实现了真正的变迁,我们和机器的交互方式也变成了从出生起就一直在学习的「自然语言交互」。以往开发者最头疼的三大问题:如何安装环境、如何实现 & 如何报错、如何部署服务,都在这个 AI 时代得到了解决。
如果想进一步简化开发流程,让 AI 帮我们一键搞定开发-部署-运维-运营的“四步走”,就需要云端的协作。CSDN 开发的 InsCode 就是个一站式的在线智能开发平台,解决了传统开发模式中复杂低效的痛点,更好地提升编码效率。
编程新时代,开发环境全面升级
具体观察到代码生成工具的使用环境中,我们发现有 41% 的开发者选择通过 Chat App 使用代码生成工具(见图 9);结合刚刚看到的 ChatGPT 选用率一骑绝尘的结果,这并不意外。这些工具固然可以帮助我们更快地编写代码,但如果没有人工输入,它们仍然无法自行完成所有工作。因此,直接使用对话式窗口似乎更符合广大开发者的需求。
图 9 代码生成工具使用环境
此外,近 37% 的开发者通过 IDE 插件生成代码;21% 的开发者通过本地部署服务使用代码生成工具。事实上,IDE 和 Chat App 的差距并不大。当两者实现了逆转,可能推动开发工具行业朝着更加集成和自动化的方向发展,进而改变许多传统厂商的生态。
在付费意愿方面,有 38.82% 开发者希望代码生成工具完全免费(见图 10)。付费意愿在「0-30 元/月」的开发者,占调查样本的 44%。将这两大人群加起来,我们可以得到 82.82%这个数字,看来“白嫖”永远是王道啊。这或许正是 ChatGPT 的选用率断层领先其他代码生成工具的原因。
图 10 代码生成工具付费意愿
作为参考,坐拥 1,300 万用户的 GitHub Copilot 目前月费 10 美元,年费 100 美元。你希望的定价方式是怎么样的呢?欢迎在评论区留言。
开发者现在都用工具做什么:代码补全和生成仍是主要功能
当前,开发者主要使用工具完成代码补全/代码生成,而代码注释、单元测试等功能也较受欢迎。此外,主流的代码生成工具都有文档查询、互动提问等功能,协助开发者跨技术栈开发。
目前,使用 AI 工具进行单元测试与 Debug 的开发者仍属于少数。将代码生成工具用于「简化工作流程」,是开发者的主流选择(见图 11)。
图 11 代码生成工具功能使用分布
面对尚处于“成长期”的代码生成工具,许多开发者也提出了自己的诉求。
大多数开发者希望进一步提升代码生成质量(见图 12),毕竟这是目前许多工具都存在的问题。此外的热门诉求还包括提升注释的可解释性、兼容更多环境等,几大诉求的投票数事实上差距比较接近,可以看出代码生成工具仍需要全方面的提升。
图 12 代码生成工具功能优化诉求
开发范式趋势:七大挑战受到了开发者同等关注
开发者趋势:模型技术为关注重点
根据调查(见图 13),大模型技术、开源、生成式 AI、算力这些热词都是开发者最关注的技术突破方向。而更深远的问题,比如与信息隐私、日常生活息息相关的价值对齐、安全合规等问题,受关注度弱于其他技术突破方向。这可能是因为很多人还未对「人工智能的潜在伦理风险」产生实感,这些情节暂时还存在于电影之中。
图 13 开发者关注的人工智能突破方向
机遇与挑战并存的人工智能时代
开发者眼中的发展挑战被大致分为七种,其中客观挑战包括数据问题、人才供给、监管风险和基础设施,主观挑战包括场景需求、重视程度以及实施成本。
「人才」和「数据」是最受关注的两大挑战(见图 14)。前文提到,数据是基础架构层的一部分,它构成了人工智能算法训练和优化的关键要素。在大数据时代,尽管数据量呈指数级增长,但获取高质量的数据、处理数据偏见、保障数据安全与隐私,以及有效利用数据进行创新研究等方面依然面临巨大挑战。
图 14 开发者眼中的发展挑战
随着 AI 技术日益复杂化,对具备跨学科能力、能够处理复杂数据分析、算法开发与优化的专业人才需求也随之激增。人才短缺不仅体现在高端研发层面,也包括能够将 AI 技术应用到实际业务场景中的复合型人才培育,以及普及人工智能教育以培养广泛的 AI 意识和技术理解。
开发者眼中的发展机遇同样丰富多彩(见图 15)。拥抱开源、出海与国际化、深耕模型技术、发力国产替代、挖掘商业场景、加强数字化建设……这些都是亟待积极把握的多元化发展机遇。
图 15 开发者眼中的发展机遇
开源生态的繁荣为开发者提供了丰富的工具箱和协作平台,让他们能够站在巨人的肩膀上创新。在 AI 时代,越来越多的企业和个人开发者参与到全球开源社区中,Meta LLaMA 一经问世疯狂刷屏,成为了开源大模型的优秀范例。
人工智能产业全景图
AI 开发者生态报告重磅发布《2023 年度人工智能产业全景图(海外版 & 国内版)》,由 CSDN、《新程序员》编辑部联合编撰(见图 16 & 17)。围绕 AI 全产业链,一图呈现国内外 AI 芯片、传感器、平台/模型、云/数据、通用技术、AIGC、应用落地等领域技术生态架构。欢迎访问下方链接获取高清全景图,扫码参与更新。
Gitcode 地址:https://gitcode.net/programmer_editor/2023
图 16 人工智能产业全景图(海外版)
图 17 人工智能产业全景图(国内版)
4 月 25 ~ 26 日,由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的「全球机器学习技术大会」将在上海环球港凯悦酒店举行,特邀近 50 位技术领袖和行业应用专家,与 1000+ 来自电商、金融、汽车、智能制造、通信、工业互联网、医疗、教育等众多行业的精英参会听众,共同探讨人工智能领域的前沿发展和行业最佳实践。欢迎所有开发者朋友访问官网 http://ml-summit.org、点击「阅读原文」或扫描下方海报中的二维码,进一步了解详情。