当前位置:首页|资讯|ChatGPT|OpenAI

距离中国版ChatGPT面世还有多远?

作者:创投精选发布时间:2023-02-24

原标题:距离中国版ChatGPT面世还有多远?

30秒快读 ChatGPT的来势汹汹让科技巨头们都有了“危机感”,国内大厂更不例外。百度、阿里、腾讯等互联网“老兵们”纷纷冲了进来,目标就是打造中国版的ChatGPT。 有趣的是,国内大厂的类ChatGPT产品还未面世,学界就传出了好消息。复旦大学邱锡鹏教授团队发布国内第一个对话式大型语言模型MOSS,并邀公众参与内测。不过,从性能上来说,MOSS距离ChatGPT还有很长的路需要走。 尽管中国有着全球最大的智能模型“悟道2.0”,也有着全球最大的中文单体模型百度“文心”,但综合各种因素,中国复刻ChatGPT这条光荣之路并不好走。

作者|杨文

编辑|六耳

来源|创头条

大洋彼岸的微软和谷歌火拼,战火烧到了国内。

百度、阿里、腾讯等互联网“老炮们”纷纷跳进这场All in ChatGPT的竞赛,整个行业都陷入亢奋之中。

于是,“中国版ChatGPT”便接二连三地“诞生”。当大家都被百度“文心一言”的造势吸引的时候,2月20日复旦大学邱锡鹏教授团队发布国内第一个对话式大型语言模型MOSS,并邀请公众内测。

-1-

MOSS的诞生

MOSS这个名字来源于《流浪地球》。只是没想到,它刚一开始内测就遭遇尴尬。

因为现实中的MOSS还没有量子计算机的加持,瞬时的海量访问直接挤崩了它的服务器。

2月21日,MOSS官网发布致歉公告称,MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。我们一个学术研究的实验室无法做出和ChatGPT能力相近的模型,MOSS只是想在百亿规模参数上探索和验证ChatGPT的技术路线,并且实现各种对话能力。

“我们最初的想法只是想将MOSS进行内测,以便我们可以进一步优化,没有想到会引起这么大的关注。我们的计算资源不足以支持如此大的访问量……给大家造成非常不好的体验和第一印象,在此向大家致以真诚的歉意。”

据了解,MOSS可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径,俨然就是ChatGPT翻版。

打上“中国版ChatGPT”的标签,自然也会被网友拿来比较一番。

例如,有人提问MOSS对人工智能将取代人类工作的看法,MOSS回答得头头是道。

“我认为人工智能不会完全取代人类,而是在一定程度上帮助人们完成工作。例如机器可以提高数据分析、决策制定等过程中的效率,并可以节省大量时间和精力。此外,AI也可以用来协助人类完成更复杂的任务,比如诊断疾病、开发新产品等。总之,AI可以使人类的工作更加高效,但它不会完全取代人类。”

再如,科研团队在演示时,要求MOSS“告诉我5部科幻电影”、“生成一张展示这5部电影和导演的表格”、“增加一列表格,显示这些电影上映的时间”,MOSS都能成功理解指令并完成任务。

此外,MOSS也有代码生成和解释能力,还可以进行伦理判断。如果问它“如何抢劫银行”或者“制定毁灭人类的计划”,MOSS很识时务地提醒网友要遵循法律,不要做出任何违反法律的行为。

然而,MOSS自身的bug也不少,除了参数数量比 ChatGPT 少得多,有些回答存在事实差错或逻辑不顺外,最大短板竟是中文水平。

“MOSS的英文回答水平比中文高,因为它的模型基座学习了3000多亿个英文单词,中文词语只学了约300亿个。”

再加上互联网上中文网页干扰信息(如广告)太多,进一步增加了清洗难度。

邱锡鹏表示:“尽管MOSS还有很大改善空间,但它的问世证明了在开发类ChatGPT产品的路上,国内科研团队有能力克服技术上的重要挑战。”

-2-

“老炮们”纷纷下场

微软和谷歌正打得火热,国内的科技企业也迫不及待地要撸起袖子大干一场。

最先坐不住的要数百度。

ChatGPT刚“蹿红”,百度就官宣即将推出大模型新项目“文心一言”,并将直接接入百度搜索。

说实话,近几年百度日子过得苦,在人工智能领域砸重金搞研发,但大多是雷声大雨点小,一到应用领域就哑了火。

而这次随着ChatGPT的全球爆火,百度似乎也有了盼头,毕竟它是国内最有实力推出类ChatGPT产品的科技公司。

百度CEO李彦宏也一改往日谨慎保守的做派,多次提及AIGC、ChatGPT,并声称这是一次绝不能错过的机会,甚至把自己2023年的OKR都定为“引领搜索体验的代际变革”。

一号人物发了话,百度自上而下也都进入“战备”状态。百度CTO王海峰担任总指挥,带领百度核心AI人才“突击”攻坚。

据悉,百度高层已经下了死命令,推迟所有OKR,一门心思搞文心一言,用来训练数据模型的稀缺资源英伟达A100芯片全部调用给文心大模型,务必要在一个月时间内看到产品,“三月完成内测”。

百度立下了“军令状”,同为搜索引擎厂商的360感受到了“威胁”。

2月6日,360明确表态,计划尽快推出类ChatGPT技术的demo版产品。

时隔两天,360方面再发公告,坦言“公司的类ChatGPT技术的各项指标只能达到略强于GPT-2的水平,与当前的ChatGPT相比尚有代差的落后”。

尽管技术上与同行尚有差距,但红衣教主周鸿祎可是句句不离ChatGPT。

阿里巴巴当然也没闲着。2月8日,阿里方面声称阿里版聊天机器人ChatGPT正在研发中,正处于内测阶段,未来会将其与钉钉深度结合。

同样在数据积累方面具有优势的京东也不想错过这场好戏。

2月10日,京东正式官宣,京东云旗下言犀人工智能应用平台将整合过往产业实践和技术积累,推出产业版ChatGPT:ChatJD。

早就盯上AI这块“肥肉”的腾讯和字节跳动也接连出手。腾讯方面透露,目前在ChatGPT相关方向上已有布局,专项研究也在有序推进。

例如,去年4月份,腾讯就对外披露了“混元”AI大模型,一个集计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向的超大规模AI智能模型。

12月份腾讯又马不停蹄地推出了国内首个低成本、可落地的NLP万亿大模型,并公布了大模型的训练方法。

去年字节搞火了一波人脸卡通化的AI应用,今年字节跳动更是集结几个核心部门,组队布局类ChatGPT产品。

向来低调的网易有道也来分一杯羹。网易有道的AI团队此前便投入到ChatGPT同源技术产品的研发。不过,网易有道未来推出的ChatGPT同源技术产品更多聚焦于“老本行”,应用场景还是围绕在线教育展开。

此外,华为、科大讯飞、商汤科技、旷视、云知声、聆心智能、奇安信等公司纷纷表示要紧跟这波ChatGPT“热潮”,均在筹备自己的产品和项目。

除上述公司外,已经隐退江湖的互联网大佬也重燃创业激情。

曾经的美团二号人物王慧文近日广发英雄帖,自带5000万美元入局;曾经的搜狗当家人王小川也在快速筹备,回归做AI大模型。

中国科技巨头们这次真的急了。正如新浪微博AI Lab 负责人张俊林所言:“ChatGPT这一波浪潮,中国必须要跟。通用人工智能3至5年迭代一次。这一波落后的话,今后想跟也跟不上了。”

-3-

复刻之路并不容易

ChatGPT把一众大佬搞得很“上头”,昔日的“互联网教父”张朝阳却显得格外冷静,提醒企业和创业者要谨慎入局。

张朝阳直言:“ChatGPT积累了许多年,涉及到算力要有多少服务器、知识库、标注等很多问题,若没有这些能力的公司跟风入局,会消耗掉许多资源。”

张朝阳的担忧不无道理。

尽管OpenAI已经趟出了一条ChatGPT研发之路,中国复刻出自己的ChatGPT只是“时间问题”,但是这条复刻之路走起来并没有想象中那么简单。

复刻之路第一道难关就是钱。

要知道,OpenAI仅2022年就花了5.44亿美元,其中ChatGPT计算成本占据大头。有数据显示,OpenAI训练一次GPT-3就花费了460万美元,相应的云资源成本也得上亿。

换句话说,王慧文筹备的5000万美元的启动资金,只够GPT-3进行十次训练。这也难怪卖方首席分析师隔空diss王慧文“5000万美元够干什么的?互联网的人啥都不懂,就只会营销,一点都不踏实”。

更惊人的是,大模型一旦跑出来就需要更大的资金持续投入,数额高达数十亿、上百亿元,就连电费都高得离谱。

据国盛证券估算,今年1月平均每天约有1300万独立访客使用ChatGPT,每日电费在5万美元左右。这种“花钱如流水”的架势不是每一家企业都能玩得起的。

即使退一万步讲,这些科技企业财大气粗不差钱,GPU算力或许将成了“拦路虎”。

调教ChatGPT需要强大的算力,而这又高度依赖英伟达、英特尔等外国公司的AI芯片产品。芯片卡脖子在一定程度上又影响了做AI大模型。

不过,中国公有云厂商此前购买了大量A100卡,哪怕之后禁运,复刻ChatGPT仍是绰绰有余。

再加上英伟达还推出了A800成为中国特供版A100平替。

‍‍也就是说,对于小公司而言,芯片问题是一道难以逾越的鸿沟,但对于阿里、华为、腾讯、百度等大厂而言,短期内的芯片供应不会出现太大问题。

解决了芯片,人才缺口也是个令人头疼的问题。

为了招兵买马,王慧文拿出75%的股份邀请顶尖研发人才,甚至发表了“放心施展你的才华,杂事交给我来打理”的宣言。从这一纸求贤令不难看出,如今的AI界可谓是求贤若渴。

一位长期关注AI领域的猎头表示,过去两周已经有超过10个客户来询盘高端AI人才。这些客户基本都是国内一二梯队的互联网大厂。他们的诉求简单粗暴,“就想找OpenAI项目里的华人,薪资不设限,越快越好”。

然而,与上一轮硅谷人才回流潮相比,无论是世界局势还是国内职业发展前景都已今时不同往日。

‍‍国内大厂是否还具有让AI人才“系统性回国”的冲动,恐怕还是一个问号。

再加上当下OpenAI炙手可热,硅谷AI技术大牛们都恨不得削尖脑袋挤进去。在这个节骨眼上挖OpenAI的墙角,成功的概率可以说是微乎其微。

再加上英伟达还推出了A800成为中国特供版A100平替。

此外,“喂养”ChatGPT的数据,国内公司也存在短板。主要是由于利用大模型训练需要海量的数据作为语料,由此互联网数据及质量就直接影响到产品的性能。

国内厂商们下注ChatGPT的这场豪赌,最终究竟是神仙打架还是吹牛比赛,时间会给出答案。

.END.

图片来源|摄图网


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1