ChatGPT不再是大公司的独角戏。
2月9日,昆仑万维(300418.SZ)在其官方微信公众号上宣布与奇点智源合作,将在今年内发布中国版类ChatGPT代码开源。
据了解,ChatGPT是由美国人工智能公司OpenAI 研发的聊天机器人 ,于2022年11月发布,仅花了60天,就达到了月活过亿,成为史上用户增长最快的互联网应用。一时间,微软、谷歌等互联网巨头纷纷响应。
作为AI前沿探索应用的ChatPGT,有望引领下一轮科技革命。在该领域,互联网巨头投入与技术积累有着先天的垄断优势。拥有全球数量众多互联网企业的中国,如何追赶上ChatGPT潮流?这是一个既现实又残酷的问题。
Linux打败了Windows Sever,MySQL打败了Oracle的案例,似乎为中国AI赶超美国AI提供了一个“1+1>2”的思考。
“让全世界所有技术工程师通过天工开源项目联合起来,打败M(微软),打败G(谷歌)。”这正是昆仑万维基于国内互联网业现状,为抓住ChatGPT技术前沿而发出的倡议。
代码开源有望让众多中国本土互联网企业,在追赶ChatGPT的技术潮流中,发挥好自己独有的优势,共同完善中国版ChatGPT。
开源是中国AIGC弯道超车的机会
不断利用人工智能技术赋能现有业务发展,或许是昆仑万维在中国AIGC领域弯道超车的一种探索。
“不可否认,中国的IT技术整体落后于欧美,但近二十年来迅速拉近差距的⼀个重要因素是因为有开源软件的存在,让广大的中国开发者和初创企业存在弯道超车的机会。”昆仑万维CEO方汉在接受专访时表示,在AI领域,开源也同样会极大刺激中小开发团队的增多。
在方汉看来,只有开源才能满足各种长尾需求,真正做到百花齐放,而不会出现由大型互联网公司独霸AI基础设施的局面。
举一个例子,OpenAI之前发布的文生图产品Dall-e2,运用的是一款代码闭源的产品,发布半年后才推出基于开源的产品Stable-Diffusion,在数量级上随即秒掉了前者。目前,在世界上最大的代码托管平台Github上,基于Dall-e2的项目只有202个,而基于Stable-Diffusion的项目亦高达2758个,前者不到后者的十分之一。
“因为开源的强大生命力,大量开发者可以基于开源的Stable-Diffusion制作适合自己的模型和应用。”方汉认为,“这就是在AI研发中开源打败闭源的又一案例。”
同样,在AI研发的底层平台中,开源的Pytorch已经击败闭源的所有竞争对手,成为使用人数最多的底层平台。
“我认为,没有开源就没有移动互联网时代的蓬勃发展,没有开源也没有AIGC这个领域的蓬勃发展,我们坚信开源是AIGC生态发展的土壤和重要的推动力量。”方汉指出,通过众创,可以加速迭代各种功能开发,积极促进技术民主化,降低行业门槛。
上述一系列的数据和事实,坚定了昆仑万维从倡议开源到通过开源促进行业生态,从而使得中国的AIGC具备弯道超车的可能。
昆仑万维从2020年开始布局AIGC领域,组建了近百人的研发团队。去年12月15日,昆仑万维正式发布「昆仑天工」,AI生成能力目前已覆盖图像、音乐、文本、编程等内容模态,昆仑万维已是目前国内AIGC领域布局最为全面、首个全身心投入AIGC开源社区的公司。
“昆仑天工”这一名称的由来,是明朝科学家宋应星所著《天工开物》,一本古老的技术百科全书。这一名称寄托着昆仑万维集团对技术的原始信仰:不仅致力于在AIGC技术创新,还要通过开源来推动中文AIGC生态的健康发展。
“我们致力于推进开源AIGC算法和模型社区的发展壮大,降低AIGC技术在各行各业的使用和学习门槛。”方汉表示。
自去年12月份昆仑天工开源项目发布以来,获得了大量好评,成为AI开源领域成长最快的项目之一,目前已经有中国移动咪咕等企业测试使用。
2月8日,昆仑万维宣布旗下的Opera浏览器计划接入ChatGPT功能,成为全球除微软Bing必应搜索引擎、Edge浏览器之外,又一家集成ChatGPT功能的浏览器。结合最前沿的技术ChatGPT,Opera将为全球用户带去领先的体验。
同时,昆仑万维在全球的平均月活跃用户有4亿,具有丰富的行业经验,将助力AIGC应用的持续落地。
方汉表示,希望通过开源,吸引更多创业者和商业公司加入到AIGC事业之中。
——或许,中国AI领域的弯道超车机会就在眼下。
ChatGPT是AI领域里程碑
ChatGPT的出现具有划时代的意义,它证明了一个技术方向的成立,也就是机器能根据人的反馈进行强化学习(RLHF)。
“它与之前常见的语言模型 (Bert/ Bart/ T5) 的区别,几乎是导弹与弓箭的区别,一定要引起最高程度的重视。”方汉表示,“我在2019年底看到GPT3的发布之后,就敏锐地意识到,一场改革即将来临。”与GPT-3等大模型相比,ChatGPT回答更全面,可以在大范围、细节问题上给出较合理准确的答案,相较以往的大模型知识被挖掘得更充分。
与ChatGPT的一通嗨聊后,方汉对ChatGPT打出了7-8分的高分,“因为它在智商测试里考了85分,这是有史以来最高的。”方汉介绍说,它是用RLHF的回馈机制,强训 GPT-3.5后得出来的产品,效果的确非常惊艳,意义是非常大的。
比现有模型的超越性,体现在它可以给出更近似正确的回答,极大地提高了大语言模型的输出结果,让AI的效果得到了一个质的提升。
从技术演进路径上看,初代 GPT-3 模型通过预训练获得生成能力、世界知识和情景学习( in-context learning)。通过情景学习的模型分支获得了遵循指令,和能泛化到没有见过的任务的能力。再经过代码训练的分支模型,则获得了代码理解的能力,作为代码训练的副产品,模型同时潜在地获得了复杂推理的能力。结合这两个分支,code-davinci-002(代码达芬奇-002),似乎是具有所有能力的最强 GPT-3.5 模型。
“接下来通过有监督的 instruction tuning 和 RLHF 通过牺牲模型能力换取与人类对齐,即对齐税。”方汉介绍说,RLHF使模型能够生成更翔实和公正的答案,同时拒绝其知识范围之外的问题。
但是,现阶段的ChatGPT最大问题是,它仍然是在模仿人类的回答。
“你在问它一个问题的时候,它并不是理解了这个问题,而是按照历史经验给你一个他认为你觉得正确的答案。它了解人性,给到的未必是真正正确的答案。”方汉表示,“简而言之,ChatGPT现在可以替代20%~30%的底层工作,但仍然不是真正意义上的人工智能。”
在方汉看来,真要实现我们想象中的那种人工智能可能还有很多步要走,跟GPT-3一样不是不可逾越的。
展望后续的GPT-4模型,“目前已有多个业界传言称,可以全面通过图灵测试。”方汉表示,该测试是评价机器是否具备人类智能的方法,这无疑会是AI史上又一个伟大的里程碑。
构建AI生态圈
事实上,再好的AI技术,也需要通过应用落地,构建其专属的生态。
在2008年成立之初,昆仑万维便切入海外市场,“航海”经验丰富。在出海过程中,又通过收购、内部孵化等方式不断丰富业务矩阵。目前,昆仑万维从一个以移动游戏为核心的公司,发展为聚焦互联网主赛道、多元布局的出海企业,业务遍及全球100多个国家和地区。
昆仑万维旗下业务包括海外信息分发及元宇宙平台Opera、海外社交娱乐平台StarX、全球移动游戏平台Ark Games和休闲娱乐平台闲徕互娱。四大业务板块服务着累计月活跃近4亿的用户,这一庞大的用户群体,又是昆仑天工面向B端、C端构建AI生态的底气。
方汉分析说,“目前的AI革新主要是在技术层面,我们更愿意把AI技术落地到C端产品应用层面,促进技术的产品化,让用户更方便地去创作内容。”
昆仑万维一直在通过完善昆仑天工模型,使之能够辅助人类更快的生成内容,而不是只生产素材就完事了。
在方汉看来,不能说只画个图或生成个视频就足够了,要想一下什么样的图用户才愿意看、什么样的视频用户还愿意看,这里面还有很多的工作要做。
方汉介绍,接下来,昆仑万维对昆仑天工的优化将从两个方向进行:第一个方向,紧跟业内先进水平,训练自己的ChatGPT;第二个方向,让文本生图、文本生代码、以及文本生文本,向实际应用上靠近。
“我们在扎扎实实的搞研发。像OpenAI这类的公司不太屑于做应用,但我们自己会做应用,然后用应用上的需求,去反推和增强我们的模型训练,这是我们跟OpenAI的区别。”方汉如是说。
方汉感慨道,随着AI投入研发的工作做得越多,越能感受到市场很大,技术创新的可能性越多。
以AIGC为例,对现有行业的影响,主要是降本增效。它不是百分比级别的,而是十倍、百倍级的降本增效。
通俗点讲,就是能给B端省钱,给C端省事。“这样会极大的提高内容生产的效率,解放生产力。”方汉认为,所有的内容行业,包括游戏行业和影视行业,都有非常强的市场需求。
“我们是一家全球性的互联网公司,涉足浏览器、社交和游戏三个领域,这三个领域其实都是跟内容比较相关,我们属于一个内容互联网企业。我们认为AIGC是对内容产业的一个巨大契机,我们也愿意全身心投入,来寻找我们的第二曲线。”方汉表示。
在很多长尾行业中,AIGC不仅极大提高内容生产效率,甚至还重塑行业赛道,衍生出更多的产业机会。期待未来更多中国本土企业都能在由开源形成的AI生态中,找到自己重塑行业赛道的机会。(思维财经出品)■