五天超过百万用户,两个月获得上亿用户。ChatGPT的火爆肉眼可见,这家企业的创始人包括马斯克和彼得蒂尔等知名大佬,后又背靠微软,从微软获得了数据(比如微软小冰采集的对话数据,比如GitHub的开源代码库)、算力(微软Azure是全球前三云服务供应商)、资本(微软数轮入资,今年还将投资几十亿美元)等方面的全面支持。可以说整个硅谷的资源都被调动起来聚焦到ChatGPT身上。
ChatGPT的优势在于:它真的有用。之前很多人将人工智能叫做人工“智障”,因为其他人工智能往往答非所问,或者你要按照人工智能习惯的方式来提问才能得到正确答案,而ChatGPT具备上下文语义理解能力、逻辑能力。如果你问的问题它不懂,它就会向你反问,要你补充问题的信息,最终通过一问一答找到你真正需要的问题答案。
在文本创作,在知识数据搜索,在代码书写等方面,ChatGPT都有优于谷歌等搜索引擎的用户体验,这让AI领域深耕多年的谷歌艳羡不已,也让其他一众聊天机器人黯然失色。而一旦用户数量达到一定规模,通过用户的提问,在线数据将支持ChatGPT的数据训练集进一步丰富。可以说ChatGPT让AI达到了一个奇点,而这个奇点之后有可能是一轮AI领域的“宇宙大爆炸”。
国内也有很多聊天机器人,但相比ChatGPT还有很大差距,大多数国内AI都是一问一答,且有的时候还会误解用户的意思,让人啼笑皆非。国内AI为什么会和美国的ChatGPT拉开差距呢?原因是多方面的:
其一,从技术资本层面,最大的限制来自于算力、算法、数据。
算力方面,我国的数据中心多面向软件应用环境,比如游戏服务器外包,真正面向AI的算力非常少,又或者需求不高,而算力本身是非常昂贵的,模型越大,数据越多,数据训练AI所要消耗的费用就越大,一次集中算力训练需要几百万美金的算力,这是国内AI公司不能负担的。
数据方面,国内数据普遍质量不高,一方面是因为数据本身积累上的问题,比如小冰的免费AI对话来积累数据,比如GitHub这样的代码开源网站比较缺乏。另一方面是因为数据管理较为严格,部分数据文本需要审批才可以被人工智能企业使用,减慢了数据价值释放。
算法方面,我国AI开发者有思维惯性,过度依赖于开源内容,对大模型缺乏探索创新。当然,算力、算法、数据的问题有些也是资本问题,没钱导致没办法进行大模型、大数据量的训练,但有些也是管理需要改进的地方。
其二,从管理层面,数据要素流通需要进一步打通,除此之外,我国对AIGC的内容创作也要采取开放包容的态度。AIGC作为技术黑箱,其产出内容往往是不可知的,在输出内容方面要允许AIGC犯错误,让AI企业敢于在技术上突破。
综上,一方面要堆钱,算力、数据、算法都要钱。另一方面要松绑,宽松能够让技术生长速度更快。但短期比较迫切的要做一件事,如果ChatGPT开源,当然皆大欢喜,国产势必跟上,如果ChatGPT不开源,我们是否应该引进ChatGPT,引进ChatGPT理由有两个:一个是看看ChatGPT是否在国内存在合规障碍,属于抛砖引玉,如果ChatGPT可行,国内企业就会模仿,另一个是因为ChatGPT对代码写作和内容创作来说是一种生产力工具,能够提高内容产量。
当然,实事求是地说,中国人工智能近些年的进步是巨大的。当前,全球人工智能发展呈现中美两国引领、主要国家激烈竞争的总体格局。中国人工智能发展成效显著,人工智能创新水平已经进入世界第一梯队,与美国的差距进一步缩小。但中国在人工智能人才方面仍落后于美国,中国的人工智能基础学科建设方面不及美国。
而ChatGPT热潮席卷全球的背后,同样给我国一个深刻的思考,人工智能作为未来产业、经济社会发展中一项变革性技术与关键性力量,深刻影响着未来世界竞争格局。于中国而言,在人工智能发展领域并非到了“刀枪入库马放南山”,反而恰恰如中国的一句话俗话说:逆水行舟不进则退,所以,我们在人工智能技术及产业发展上依然任重而道远,须臾松懈不得。
(作者系浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员,工信部信息通信经济专家委员会委员)
本报专栏文章仅代表作者个人观点。