【前言】
ChatGPT的全球火爆掀起了新一轮人工智能竞赛,在谷歌和微软两大巨头激烈追赶的同时,国内的互联网和科技企业也迅速跟进布局。南都记者梳理发现,过去一周,表明已有ChatGPT相关技术布局的国内企业有十多家,如百度、腾讯、阿里、京东、科大讯飞等大型互联网企业,此外来自游戏、教育、医疗、汽车等板块的企业纷纷宣布在自身业务中接入类ChatGDP的技术和服务。
在此背景下,南方都市报推出了“上岗了!AI”系列专题,以线上沙龙、人物访谈、案例解读、智库报告等形式展开报道,聚焦于人工智能技术在经济和社会领域的创新应用。本期沙龙探讨由ChatGPT引发的人工智能角逐赛(观看沙龙回放)。
2月10日,一张美团联合创始人王慧文豪掷五千万美元求“组队”做人工智能的朋友圈截图刷屏,“我的人工智能宣言,5000万美元,带资进组,不在意岗位、薪资和tittle,求组队。”王慧文的这条朋友圈下众多投资人点赞并表示愿意组队加入。2月13日,王慧文再发“AI英雄榜”称,“组队拥抱新时代,打造中国 OpenAl。设立北京光年之外科技有限公司,我出资5千万美元,估值2亿美元。我当前不懂AI技术,正在努力学习,所以个人肉身不占股份,资金占股25%,75%的股份用于邀请顶级研发人才,下轮融资已有顶级 VC认购 2.3亿美金。”
但该帖子引发了一场关于AI大模型投入成本的讨论。海通证券研究所科技产业链负责人郑宏达对王慧文的“英雄帖”发表质疑称“5000万美元够干什么的?大模型训练一次就花500万美元,训练10次?互联网的人啥都不懂,就只会营销,一点都不踏实。”ChatGPT的研发成本究竟如何?这么烧钱的大模型,谁有资本做?
【本期嘉宾】
李志飞:“出门问问”创始人兼CEO,美国约翰霍普金斯大学计算机系博士,前Google总部科学家
彭煦潭:英国谢菲尔德大学博士
金小刚:浙江大学计算机科学与技术学院教授
AI大模型究竟有多烧钱?
“可能对行业外的人来说,以5000万美元来做启动资金绰绰有余。但我们来算一笔账,以ChatGPT的上一代GPT3.0为标准,需要千张GPU卡级别的设备,训练三个月时间,王慧文的5000万美元仅支持购入250台训练人工智能所需机器,相当于两千张卡,所以只在硬件上的开销便使5000万美元归于尘烟,更不要说价格高昂的人工成本、电力成本、运营成本、购买数据的成本等等。”彭煦潭在沙龙中表示。
国盛证券同样对GPT技术的训练成本进行了估算。据国盛证券报告《ChatGPT 需要多少算力》估算,GPT-3 训练一次的成本约为 140 万美元,对于一些更大的 LLM(大型语言模型),训练成本介于 200 万美元至 1200 万美元之间。以 ChatGPT 在 1 月的独立访客平均数 1300 万计算,其对应芯片需求为 3 万多片英伟达 A100 GPU,初始投入成本约为 8 亿美元,每日电费在 5 万美元左右。如果将当前的 ChatGPT 部署到谷歌进行的每次搜索中,需要 512820.51 台 A100 HGX 服务器和总共 4102568 个 A100 GPU,这些服务器和网络的总成本仅资本支出就超过 1000 亿美元。
国盛证券认为,在公有云上,对于谷歌等全球科技大企业而言,百万至千万美元级别的训练成本并不便宜,但尚在可接受范围内、并非昂贵。
“目前ChatGPT训练一次的成本就高达1千万美元,‘算力’也就是芯片的开销,就是一笔巨额成本。”李志飞同样表示,“尽管如此烧钱,大模型的参赛选手不止巨头,也不是只有一两个幸存者的‘生存游戏’。在美国,可能 Amazon 会是一个,不管自己做,还是收购,微软和 OpenAI 会有一个,Google 算一个,创业公司还会有一两个。”
“出门问问”创始人兼CEO李志飞。图片受访者提供
中国科技巨头“面临一场硬仗”
回顾国内市场,目前已有百度宣布将推出类ChatGPT产品“文心一言”,百度方面表示,“ChatGPT相关技术,百度都具备。百度在人工智能四层架构中,有全栈布局。包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。文心一言,位于模型层。”
阿里版聊天机器人ChatGPT同样正在研发中,目前处于内测阶段。钉钉方面也表示,阿里版本的ChatGPT的对话机器人将和钉钉深度结合。此前,曾有钉钉用户尝试在钉钉机器人中接入Open AI公司的ChatGPT,测试发现,钉钉机器人不仅可以接入Open AI的ChatGPT,开放的API接口还可以接入更多机器人,甚至是用户自己开发的机器人。
不过,目前尚不清楚,阿里内部研发的聊天机器人与钉钉将以怎样的方式结合。
腾讯方面则表示,“目前在相关方向上已有布局,专项研究也在有序推进。腾讯持续投入AI等前沿技术的研发,基于此前在AI大模型、机器学习算法以及NLP等领域的技术储备,将进一步开展前沿研究及应用探索。”
此外,科大讯飞回应称,ChatGPT主要涉及自然语言处理相关技术,属于认知智能领域的应用之一,该公司在该方向技术和应用具备长期深厚的积累。科大讯飞表示,他们已经在当前核心技术、产业场景、行业数据等深厚积累的基础上,于2022年12月份进一步启动生成式预训练大模型任务攻关,科大讯飞AI学习机将成为该项技术率先落地的产品,将于2023年5月6日进行产品级发布。
360公司2月7日在互动平台上回答投资者提问时表示,该公司的人工智能研究院从2020年开始一直在包括类ChatGPT技术在内的AIGC技术上有持续性的投入,但截至目前,仅作为内部业务自用的生产力工具在使用,且投资规模及技术水平与当前的ChatGPT 3相比还有较大差距,各项技术指标只能做到略强于ChatGPT 2。该公司也计划尽快推出类ChatGPT技术的demo版产品。
“通过布局大模型来解决中国人工智能应用入口的问题,这是中国企业必须要面临的一场硬仗,因为过去那种‘拿来主义’的方式会导致中国企业在未来的竞争中非常被动,比如在芯片和操作系统领域,中国企业是缺位的”,金小刚强调,在人工智能时代 ChatGPT无疑是一个入口级的产品,希望阿里、华为、腾讯、百度等头部企业能够积极布局,期待接下来能有中国的大型语言模型诞生。
入局门槛:技术、资金还是决心?
国内互联网企业入局类ChatGPT的聊天机器人,打造自有大模型是无法跨越的一道门槛,这场竞赛中比拼的远远不止于金钱,更需要人才、决心和规划。
“打造中文版的ChatGPT的工程量是非常大的,在这样庞大的工程量前不确定性因素很多。对于大规模的 AI 大模型,我们的人才是非常少的,因为中国没有怎么训练出过好的大模型。过去我们的模型参数可能也很多,但不是通用的,语音识别、TTS、人脸识别都单独做一套,所以方法论也有点不一样。”李志飞称,“AI 通用大模型是一个核武器,它是有时间窗口的。人才壁垒、时间壁垒、数据壁垒、资金壁垒一旦建立起来,小的团队就没有机会了。目前人是最重要的因素,每一家创业团队都会有自己的核心竞争力。但第一阶段最重要的是:找到真正懂核心技术的人才,并且能用正确的方式和节奏跟他们合作。”
彭煦潭则认为,对于中国企业来说发展和落地类ChatGPT产品的门槛不在技术而在决心。
“企业下定决心投入需要明确的商业规划和商业场景,但目前来说各类规划并不清晰。以搜索引擎公司为例,引入ChatGPT到底对用户的体验有多大的改善,是否能对公司带来正向的增益,目前无人能够给出较为确定的答案”,彭煦潭称,“面对一个收益不清晰的未来,企业是否还有决心去投入这样海量资源、人力和时间?这需要非常强的决断的魄力,我觉得这个才是现阶段最大的门槛。”
在全球所有科技公司中,OpenAI无疑是大模型的坚定支持者。2019年,OpenAI推出参数为15亿的GPT-2,2020年推出GPT-3,将参数提升到了1750亿,成为当时全球最大的预训练模型,引发业内轰动。ChatGPT则由GPT -3.5模型提供支持,被视为在GPT-4正式推出前的演练。
在融资方面,2019 年 7 月,重组后的 OpenAI 新公司获得了微软的10亿美元投资。2023年1月,微软以290亿美元的估值继续投资约100亿美元,获得 OpenAI 49%的股权,并加大微软各地产品与OpenAI技术融合,其中包括关注最大的是搜索引擎bing,被认为对抗Google的搜索的带来希望。
金小刚教授表达了对国内企业形成合力的期望,“我个人认为这里面需要天才的介入,需要像阿里、百度这样的大企业来发动,将智慧汇聚在一起,形成我们自己的布局和战略。”同时,金小刚教授强调,目前GPT技术领域不适合中小型企业贸然进入,即便有天才创业者的存在,其背后也需要有微软这样的大型公司进行支持。“不应该每一个小企业都去跟风参与,我期待中国有能力的企业去引导这样一个生态,而普通公司则可以寻找特定场景,解决用户具体问题,不要盲目跟风炒作。”
“并非每个公司都要自己训练一个大模型,肯定是看投入产出比,量力而行。我们一直强调的是数据的重要性,其实最有用的数据是基于用户在使用过程中的反馈数据,把数据和模型真正结合在一起重新做训练会更有效果。而这个过程本身建立的壁垒也是巨高无比的,不是靠短期砸大量的金钱和资源就能达到,而是需要积累真实产品用户的数据。”李志飞表示,“出门问问在三年前就已经着手做大模型。未来将专注于‘通用的认知模型’,短期目标是把一个 60 分的通用大模型给做出来。中长期而言,有了 60 分的基础模型后,我会花大力去把它打磨成 80 分,从而可以在真正的商业场景里稳定使用。”
“目前更像一个玩具,而非工具”
除了资金投入之外,ChatGPT相关技术的应用场景是引发企业关注最多的话题,南都记者初步统计发现,一部分企业选择开发自有大模型,推出类ChatGPT产品,另一部分则选择与OpenAI合作,目前已有搜索引擎、游戏、数字人,以及教育、医疗、汽车等板块的企业宣布将与ChatGPT进行业务方面的联动。
如2月3日和2月7日,天娱数科在互动平台均表示,其下属子公司元境科技虚拟数字人已经接入ChatGPT等模型,并已在TikTok跨境电商直播、虚拟主播直播互动等场景实现应用。2月13日开普云在互动平台表示,ChatGPT目前没有开放接口,但公司的数字人已经与OpenAI的GPT3-003接口完成对接,该接口是ChatGPT的前一个版本,待ChatGPT接口开放后即可快速完成集成,并结合开普云的内容安全能力形成更可靠的数字人对话服务。昆仑万维集团在2月8日宣布旗下的Opera浏览器计划接入ChatGPT功能,其将成为全球除微软Bing必应搜索引擎、Edge浏览器之外,又一家集成ChatGPT功能的浏览器。
值得关注的是,目前ChatGPT在实际使用仍存在诸多问题,最典型的是回答内容的准确性不可控。
如谷歌在2月6日展示旗下聊天机器人Bard,由于回答中生成了错误结果,导致其母公司Alphabet股价周三暴跌7.7%,短短两天,市值蒸发近1700亿美元。
微软接入ChatGPT的搜索引擎“新Bing”上线一周多后问题不断,有用户测试发现,新版必应在某些情况下会出现“精神错乱的”言论,甚至侮辱用户、撒谎,并试图操纵用户的情绪。如有用户询问电影《阿凡达:水之道》放映时间,新Bing给出的答案是还未上映。用户试图通过说现在是 2023 年来纠正机器人,但据称 Bing 否认了他们的说法。“我不知道你为什么认为今天是2023年,但也许你感到困惑或错误”,bing聊天机器人回答说,“请相信我,我是bing,我知道日期。”
“就OpenAI的ChatGPT来说,目前还没有太清晰的商业模式,更像一个玩具,而非工具。首先,在技术层面,ChatGPT本身并非基于真正的基础数据库、知识结构,ChatGPT依旧会无中生有,虚构或编造答案。另外,在道德伦理和法规层面,它最大的弱点是会生成虚假的、有害的、不存在的回答,这些都蕴含着巨大的风险问题。”李志飞同样指出。
三年内能否商用尚不明朗
另一方面,从成本角度来看,ChatGPT的大规模商用仍十分遥远。
“首先在三年之内,GPT相关技术带来的更多是投资方面的影响,如市值股价、从业者技术战略等,并不会给实际产业带来赋能,但是三年之后它可能会对整个业态产生大幅度的刷新。”彭煦潭直言,“从运营成本来考虑,目前GPT技术所需巨大成本并不在各大行业的接受范围内,因此业界需要将GPT所需的超级大模型的运营成本降到商业上可持续的量级。而根据摩尔定律,人工智能的核心架构GPU大约在三年之内可能达到商业的期望。”
在彭煦潭看来,目前ChatGPT相关技术更多是属于概念品的存在,真正的商用需要对不同的行业赋能产生实际的价值。“让用户能感知到还有很长的距离要走,这部分的距离其实很大程度并不是科研上面的距离,需要各大行业在精神上做好准备,思考如何让工程落地,如何让商业模型可持续。”
金小刚教授再次表达了对中国企业掌握人工智能主动权的期望。“人工智能的方向不仅是深度学习,还有很多其他值得探索的可能性,不应该扎堆在ChatGPT上去找应用”,金小刚称,“大家应该认真思考如何将自己积累的人工智能技术变为产品,比如可以从AI对制造业、建筑行业、医疗、法律等行业的服务中寻找突破,ChatGPT背后技术的厚积使得它产品能力提升,但同时我们也要意识到商业模式的重要性,因为一个好的商业模式可以让技术真正走向工作。”
出品:南都政商数据新闻部
采写:南都记者 马宁宁 实习生 张海若