当前位置:首页|资讯|王慧文|OpenAI

王慧文要打造中国版OpenAI,难度有多大?

作者:数智界发布时间:2023-02-15

眼下,ChatGPT引发的AI热潮还在延续。

一方面,互联网世界里的科技巨头不甘落后,纷纷推出自己的类ChatGPT产品,或者至少制定了时间表;另一方面,ChatGPT本身的技术革新,也让很多创业者看到了新机会。

比如原美团联合创始人王慧文,在从美团退休两年后,也踏入了这股AI洪流。

2月13日,王慧文在社交平台“即刻”发布“英雄榜”,称要打造中国的OpenAI(ChatGPT主体公司),同时为自己的新事业招募人才。

王慧文发文称,他设立了北京光年之外科技有限公司,自己出资5000万美元,公司的估值为2亿美元,他个人不占股份,资金占股25%,将用其他75%的股份来邀请顶级研发人才。

他同时透露,公司的下一轮融资已有顶级VC认购2.3亿美金。据36氪报道,王慧文口中的顶级VC,至少包括源码资本、真格基金等。

一个曾经在巨头公司担任二把手的关键人物、一个当下热得发烫的新风口,当这两个要素组合在一起,故事一定会极具吸引力。

但像大多数行业已经发生过的那样,一个好的故事最终会走向何方,会否顺利,也充斥着很大的不确定性。

一、技术&资金的门槛是容易迈过的吗?

尽管王慧文的新项目仍处于招兵买马的初始阶段。但从已透露出的信息来看,王慧文野心很大。

日前发布的英雄榜中,他透露公司目前只招聘研发人才,要求有三点:业界公认的顶级研发人才、狂热相信AI改变世界、坚定确保AI造福人类。

2月14日,他又发布了《AI英雄榜·续》,其中写到了对光年之外另外75%的股份规划:

如果公司上市时,这些股份仍未发完,剩余的部分不会留给任何人,而是成立一支非盈利性基金,专门投资那些发展路径不清晰,实现希望很渺茫,商业价值不明确,但是一旦突破就能改变世界的科技探索。

但是很快,就有业内人士公开发声,表达了质疑。

2月14日,海通证券分析师郑宏达在朋友圈转发了王慧文的“英雄榜”,并配文写到:“这不是扯淡么,5000万美元够干什么的?大模型训练一次就花500万美元,训练10次?互联网的人啥都不懂,就只会营销,一点都不踏实。”

这一争论发生的根源在于,无论是ChatGPT还是其他的Chat bot,都有着较高的入场门槛,主要体现在技术和资金两方面。

从更宽泛的角度来看,ChatGPT是一款生成式AI产品,与以往的决策式AI在技术路径上大有不同。它通过分析归纳已有数据后创作新的内容,而不是像之前那样,利用已知数据分别求解输出类别标签,区分不同类型数据。

这种分析、规划、进而创作新内容的能力,是需要训练出来的。

2017年Google团队提出Transformer模型,这个模型能够按输入数据各部分重要性的不同而分配不同的权重。

中信建投证券在一份研报中指出,Transformer在网络结构上的进化带来了参数量和模型层数的提高,引起了生成式AI技术能力的质变;同时并行化优势允许其在更大的数据集上进行训练,这也促成了GPT等预训练模型的发展。

在那之后,AI开始从大量训练模型向训练大模型转变,以期让AI模型具有泛化能力,让AI真正走向通用且实用。

但是在训练大模型的过程中,背后所需要的算力、云计算、数据等等,都有着极高的资金门槛。

OpenAI在一份提交给美国国税局的文件中指出,还在2017年时,它花在云计算上的钱都有790万美元。此外,其创始人布罗克曼等人测算,训练大模型消耗的计算量,每3、4个月会翻一倍。

据晚点LatePost报道,据多位业内人士估算,OpenAI训练GPT-3一年,仅算力成本就有2000万美元。

二、商业化路径与应用前景探讨

此前,在《为什么说ChatGPT还不是搜索引擎的对手》一文中,我们曾提到,随着ChatGPT的不断调优,其有望在医疗、客服机器人、虚拟人、翻译、营销、游戏、社交、教育、家庭陪护等多个领域被应用,潜在的商业模式存在以下几种:

云服务、内容营销、数据盈利、咨询服务、版权授权。

目前,诸多券商研报也对ChatGPT的应用前景做出了乐观预测,比如华西证券在一份研报中指出:

ChatGPT应用场景广泛,拥有潜在空间蓝海,其功能覆盖各个板块,我们将其分成生成应用和布局、搜索和数据分析、程序生成和分析、文本生成、内容创作、一般推理和其他七个部分。

其同时认为,基于ChatGPT庞大的算力和算法分析,领域有望覆盖教育、科研、游戏、新闻等多重板块并有望持续拓展,市场潜力较大。

但市场前景大,并不意味就能在短期内实现变现,甚至长期内的商业变现也存在不确定性。比如早在2011年苹果推出语音助手Siri时,也曾一时引发轰动,但至今为止其仍然只是phone的一个附属产品,未能找到其作为单一产品的商家价值。

这也是为什么,ChatGPT从去年底火到现在后,市场上又出现了另一种声音:希望如今的ChatGPT不是之前的元宇宙。

回到ChatGPT本身的商业化,现在也仍然处于初期探索阶段,在缺乏一定时间维度的市场检验下,存在着商业化进程不及预期的潜在风险。

OpenAI的商业模式,属于底层模型开放型标准的SaaS服务模式。即公司通过提供相关的AIGC代码,提供自动图形模型或语言模型生成等产品,用户通过其API接口接入,并支付平台费用获取相关图像、语言、代码调整服务,OpenAI可获得付费订阅式的SaaS费用。

虽然OpenAI不仅仅有ChatGPT,它的业务还包括了Dall·E2、Whisper等。DALL·E2可根据自然语言的描述创作逼真的绘画作品,Whisper则是一种语言识别系统,其鲁棒性(即系统的稳健性)和准确性极高,支持多种语言的转录并翻译成英文。

不过从一家公司的成长历程来看,OpenAI目前还处在靠ChatGPT刚刚出圈的初期阶段,无论是Dall·E2还是Whisper等产品,都需要在接下来面临跟ChatGPT同样的商业化考验。

再来看中国,目前AIGC商业化整体仍处于起步阶段,部分文本、图像等生成的公司主要以辅助生成内容服务为主,还未全面进入到单一产品的市场化和商业化阶段,尽管有部分公司已经进入AIGC开发阶段,但也还处在免费试用、获取流量阶段。

如此看来,要想成为中国版的OpenAI,绝非坦途。

三、竞争环境的残酷性

想要打造出中国版OpenAI的,显然并非只有王慧文和他的“光年之外”。

我们看到,ChatGPT火到现在,中国大多数知名的互联网&科技公司,已经加大了在AIGC领域的相关布局。

2月7日,百度方面确认,其将推出类ChatGPT的产品,该项目定名为“文心一言”,英文名字叫“WRNIE Bot”,百度预计将在3月完成内测,并面向公众开放。

最新的进展是,2月14日,上海报业集团旗下澎湃新闻成为百度“文心一言”首批先行体验官。官方称,后续澎湃新闻将体验“文心一言”的全面能力,应用百度领先的智能对话技术成果,打造内容生态人工智能全系产品及服务。

此外,“文心一言”的部分相关功能目前已经陆续在百度搜索内上线或内测,小度等公司也已经加入了百度的“文心一言”生态圈。

另一家给出明确时间节点的还有科大讯飞。2月15日,科大讯飞副总裁、研究院执行院长刘聪向媒体表示,“通过最近两个多月的系统分析和快速验证,我们非常有信心实现ChatGPT类似的技术阶跃进步。”

刘聪介绍,在ChatGPT引发的AI技术新一轮热潮背景下,科大讯飞基于认知智能全国重点实验室,已在核心算法、行业数据、算力支撑及团队组建等方面建立了优势保障。他透露,类ChatGPT技术将在今年5月率先落地科大讯飞AI学习机产品。

周鸿祎在2月9日与搜狐CEO张朝阳的《星空下的对话》中提到,“搭不上ChatGPT这班车的企业会被淘汰。”在这两天前,在回答投资者提问时,360公司称计划尽快推出类ChatGPT技术的demo版产品。

360同时承认,目前公司的类ChatGPT技术的各项指标与当前基于GPT-3.5算法的Chat-GPT相比,尚有代查的落后;最终demo版产品的发布日期和实际效果,也存在着不确定性。

除了以上几家,阿里巴巴、腾讯、京东、网易、华为等其他知名公司,也在ChATGPT上有所布局,但目前尚未透露落地时间。

可以预见,当一众具备技术根基、具备雄厚资金实力的巨头公司进入市场进行争夺,小公司、初创公司的成长难度只会更大。

换句话说,合理预测下,中国市场一定会诞生本土版的OpenAI,但是在现有的市场环境下,最大的机会仍然属于大厂。

本文来自微信公众号“数智界”(ID:gh_1eabea2d9bab),作者:魅影,编辑:嘉辛,36氪经授权发布。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1