整理 | 王启隆 何苗
出品 | CSDN(ID:CSDNnews)
“ChatGPT 爆发意味着 AI 的 iPhone 时刻来了,下一步就是应用时刻,新应用时代将来临。那程序员怎么办呢?会被替代吗?我认为不会,但程序员的技术栈将发生变化,从过去互联网程序员的 LAMP,移动的 iOS、Android,云原生的 K8s 到今天,大模型将推动更多的 AI 应用程序员产生。”
近日,Open AI 开放了 ChatGPT 模型 API,引证了 CSDN 创始人&董事长、极客帮创投创始合伙人蒋涛在全球人工智能开发者先锋大会(GAIDC)的“新程序员:人工智能新十年”论坛上的预测:“ChatGPT 爆发意味着 AI 的 iPhone 时刻来了,下一步就是应用时刻,新应用时代将来临。”
人工智能的新十年都会发生哪些变化呢?程序员会被取代吗?ChatGPT 的下一步会是什么?关于这些疑问,蒋涛都做出了解答,并可以总结为以下四点:
中国 AI 开发者在高速增长
以下为蒋涛的演讲实录:
我在这个行业做了很多年了。我是程序员出身,写了很多年代码,为程序员建设了 CSDN 平台、创办了《程序员》杂志、开设培训公司、出版社等等。我相信未来的十年会是更美好的,现在就是入门程序员最好的时代。
CSDN 历史很悠久,程序员天生离不开开放、共享、协作,所以开源的概念最初诞生于程序员的社区。CSDN 在过去的一年有很大的增长,现已拥有 4200 万的用户总量,并在去年新增了600万用户。CSDN 的 Slogan 是成就一亿技术人,我希望 CSDN 的用户在未来五年时间会涨到一亿人。
今天我带来了很多开发者数据和调查,希望能做一些宏观上的数据分析,普及基本的概念。在座有很多真正的 AI 专家,而我是一个 AI 的观察者,为大家带来 AI 领域的数据分享。
以下是 CSDN 搜集到的 AI 领域关键词。CSDN 一个月有两亿的访问用户,13 亿 PV,这些都是用户们关注的内容。其中 AI 的部分和开源的框架、项目紧密相关。
CSDN 去年做了一份《中国开源贡献度报告》,体现了中国的开源开发者在全球的贡献。我们挑选了头部的五千多个项目,这些项目和 AI 的相关性仍旧不高,因为 AI 仍未应用到普通开发者的手里,整体占比较低。
我们还用表格列出了主流的开源项目,所有的打分模式、数据都是开放的,在 CSDN 平台上可以看到每个项目的贡献。
全球 5394 个项目,做过贡献的是 20 万人,中国的开发者占 9.5%,大概不到两万人的贡献,绝大部分是全世界其他地区的开发者贡献的。可以见得,中国的开发者数量很多,但是贡献度占比还不够。中国的 GDP 大概有 30%,理论上中国开发者应该做到 30% 的贡献才合理。
如今,全球开发者数量在大幅增加,Github 新增用户两千万,印度、中国和巴西的增幅最大,占比分别为 32.4%、15.6%、11.6%。
对 AI 开发者的受教育程度统计,总计 1568 人中有 63.64% 是本科生,占比最高。此外,硕士研究生和博士研究生分别占比 17.19% 和 3.45%,大专及其他学历占比 15.72%。如今,AI 渗透到各行各业,各行各业的开发者对 AI 都有兴趣。CSDN 数据统计 AI 开发者所从事行业,软件和信息技术服务业占比近半,互联网和相关服务行业占比 24.81%。
现在,全球开发者进入了一个新的时刻,ChatGPT 突然引爆了,数据统计周期从去年 12 月到现在两个多月,ChatGPT 所引爆的语音识别/语音合成/自然语言处理是目前开发者最为关注的领域。
因为本次论坛位于上海,所以 CSDN 专门统计了上海的数据,上海在 CSDN 网站的总用户里面大概占 10%,去年新增有 46 万,这个数量还是蛮大的。排名第一的五个城市,北京、上海、广州、深圳、成都,上海占了20%,且在 AI 的领域占比较高,说明 AI 目前仍存在着高门槛的问题。
ChatGPT 将构建开源新生态
下面我会进行中美 AI 生态的一些对比。这是 CSDN 全新发布的《2023 年度人工智能产业全景图》,在 CSDN 最新一期的《新程序员 006:人工智能新十年》也有附赠。
当今 AI 行业的每个领域都有非常多的中国公司和中国创业者在参与,并在其中的部分领域占据了领先地位。美国在 AI 框架、芯片领域遥遥领先,同时在大模型领域取得突破;而中国则在计算机视觉、激光雷达领域处于领先地位。
中国在学术方面的增长速度是非常快的,论文发布量和引用量都很多,这是一个很惊人的成果。目前,中国论文数量为美国的 4.5 倍,但美国参加会议的论文数量超过中国,而很多一流的论文是在会议上发表的。中国的人工智能大多注重于细节调优领域,但是更重要的还是基础和通用的研究,这方面中国相对来说和美国相比要落后一些,总的来说两者的体量是差距不大的。
整个模型的进程是先有框架,然后再进入到开源社区。美国现在已经进化出了全新的开源社区模式,比如说 Hugging Face 和 Tensorflow,这些新的开源社区投入比较大。中国做的是内容社区或代码社区,在开源社区方面落后一点,而美国在做的是 AI 模型社区。
此外,美国的开源生态及应用的丰富度比中国好,虽然中国在论文的细节研究上领先,并且在行业上(特别是和硬件相结合的行业)的应用也有领先,但中国的基础研究还是处在相对的落后阶段。现在中国也有发展出达摩院和百度等等,但是相比美国而言,中国的开源生态还是没有构建起来。
这个时候,来了一个更猛的家伙——ChatGPT。中国的开源生态一直没能构建起来,归根结底都是没有找到突破的方向。ChatGPT 的诞生,则给全球开发者带来了一场震撼,指引了一个新的方向。
AI OS 应用前夕:ChatGPT 引领智能云时代
ChatGPT 刚出来没几天的时候,就有人邀请我们到推特上做了一次讨论,圈内的人——尤其是本来就在钻研对话机器人的开发者,纷纷表示太震撼了。ChatGPT 引领着新的趋势,原先做的 AI 应用模式和方式都应该被调整一下。但没想到,随着这两三个月以来 ChatGPT 的用户变多之后,全世界的投资者和创业者都趋之若鹜,这场已经预热了好几年的“AI 热”现在才正式开始,真正地进入所谓的 AI First 时代。
下面是我做的一张图。我自己是从 PC 程序员时代开始的,在最初的 PC 程序员时代,我学的是 Windows 的 API;到了互联网时代,开始出现对 Web 程序员的需求;接着 iPhone 时代到来了,我开始做移动开发,学习Java,开发 iOS、安卓操作系统;随后云原生时代开始了,K8S 容器技术还有 Devops 出现,这就是这二十年的技术演进。
但现在,全球程序员真正迎来了操作系统级的底座,一个以大模型和 ChatGPT 为典范的智能 OS。智能 OS 的编程模型和过往不同,程序员要提供各种提示词,这些提示词可以让大模型和智能 OS 生成文档。对于程序员来说,这意味着可以生成不同的模块和任务的完全度,然后再进行连接。因此,程序员现在进入一个崭新的 AI 应用时代。
接下来我想对比一下旧时代和新技术时代的演进。2011 年,我们在北京举办了一场云计算大会,当时人人都说云计算时代到来了,未来的云计算会像水和电一样普及千家万户。事实就是,虽然数字经济迎来了大发展,这些云计算公司把过去 IaaS 层的问题解决了,但是遗留下了应用层的问题;计算网络存储的问题解决了,但是应用到业务之间的沟通是没有的。这也是如今许多产品失败案例居多的原因,云计算时代遇到了瓶颈,这一现象在中国尤为明显。
智能云时代,则是用 NLP 对话系统改变了从业务到应用的沟通方式。
过去的业务人员描述自己的系统需求的时候,需要一位产品经理去翻译;产品经理在翻译完了再把需求交到程序员手上,程序员再写成应用反馈回去。这中间翻译的过程经常会失真,而且因为业务总是在不断调整和变化,还时常面临着需求变更的痛苦问题。
而现在的 ChatGPT 不一样。举例来说,如果我有一个朋友要写一份商业计划书,他只需把自己公司的一些资料和财务数据灌输进 ChatGPT 中,ChatGPT 就能写出一份非常丰满和有远见的商业计划书。因为大模型读了全世界所有可以公开的计划书、财务数据、财务报表,大模型比单一人类知识的深度和广度更丰富;以上面那个例子来说,人类只能表达自己公司的业务数据和业务描述,但是 ChatGPT 可以运用所有领域的知识,进行进一步的推理,这用在和业务系统的对接上,就产生了非常好的包容性。
未来所有的软件和数字化系统如果都以这种方式被重新构建,智能云时代便真正到来了。过去的百度、阿里都预想过这个正确的大方向,但一直没有人把通往智能云时代的路径连接起来,而现在,就是智能云时代的“iPhone 时刻”。iPhone改变了移动交互界面,用“Touch”的方式和用户隔着触屏交流,催生了一种新的 App 形态。
ChatGPT 现在并不是“人工智障”,但它经常会“胡掰”,它将改变的不一定是用户 C 端和产品之间的交互,而是在 B 端上有非常广阔的应用。计算机电脑在发明之初也没什么功能,尤其是 PC 刚出来时更是如此,但当时出现了一个重要发明——电子表格软件,这个软件帮 APPLE II(苹果二号)电脑卖了一百万台。
所以,ChatGPT 的下一步便是应用时刻,我们可以拭目以待一款破百万的 ChatGPT 商业应用。如今数不胜数的行业公司跃跃欲试,这会对企业服务市场产生第一波冲击,但我判断不会在 C 端上产生冲击。我预计 To B 会迎来一场大爆发,但可惜的是美国市场更有可能诞生这种应用,因为美国市场的 To B 行业本就比较发达。不过,大模型的改变会很快波及全球,揭幕新软件时代或者说新应用时代。
当然,还有一个问题:程序员怎么办?程序员会被替代吗?
我认为不会,只不过程序员的技术栈将发生变化。技术栈有一个不断演进的过程,其中很多是基于编程语言的。这个时代的“编程语言”要打一个引号,新时代的程序员要学会提炼问题,用对话的方式发挥智能 OS 的能力。提好问题、定义问题将成为很重要的能力,这决定了程序员是否能够驾驭掌握这些 AI OS。
如今的 ChatGPT 是封闭的,未来的 AI OS 还会因数据的丰富度不断进步,我也相信未来会出现开源开放的 AI OS,会出现中国的 AI OS。这一切都需要我们在未来的新十年一切做出更多更好的应用。
中国 AI 如何走向根深叶茂
会上,蒋涛携手华为云智能化软件研发首席专家王千祥进行了重磅发布:
我们很高兴能为中国开发人员提供更多更好的工具。王千祥老师曾说“程序是知识的精确表达”,我也想补充一句“程序是生产力的精确表达”。现在是 AI 从叶到根深叶茂的时刻,我相信以后的世界人人都是开发者,这是我 2017 年提出来的观点,现在 GPT 的发展和自动化编程的发展也让我们看到了这一点。
华为云与 CSDN 联合发布“智能化编程助手 Snap”。Snap 支持 IntelliJ、Pycharm、VS Code 等主流的 IDE,目前支持 Java、Python 等主流的编程语言,对其它编程语言的支持也会很快陆续发布。Snap 不仅可以自动生成代码,还可以自动分析代码,发现其中存在的部分缺陷,以提升代码质量。
昨天和阿里聊天,他们表示也要做这样的应用了,而马总说,我们的编程还缺少一个标准。如今已经有了学术标准,OpenAI 也有自己的标准,而我们也想做一个应用的标准——“猿大师” AI Coding 评测。
CSDN 的用户对写代码的需求最高,用户们想做出真正的产品,所以我们是以中文的语言加上实际的用户需求。用户的很多需求是在 CSDN 上找,所以我们更关注 text code 而不光是代码的自动生成,着力于让任务和用户的描述相结合起来。
所以我们参考了无人驾驶,为“猿大师”分了几个等级,从 C1 一直到 C5。其中最简单的就是输入法自动补缺水平;聪明一点的可以帮助用户预测;更聪明一点的可以根据用户的描述生成一个函数,甚至帮用户做调试更好一点的;最好的就能在实际上通过一个需求就写出一行代码。
我们也希望 CSDN 的用户对这些算法进行标注和测评,让人工参与优化。目前的人工智能还是需要人工的,虽然这是现在很多产品已经具备的能力,但是各个产品之间还是有差距,所以我们想做一个开放的测评标准。
大模型是个底座,但是每个垂直领域还有很多需要做的工作,代码生成就是这样,这一点如果可以做到“猿大师”的 C5 级的话,开发者的生产力可以得到极大地提升。所以我们希望开发的标准被开放出来,让每一家公司做的东西都能够帮助中国的程序员提高更大的生产力,谢谢。