拆解ChatGPT成本，太烧钱！中国科技巨头面临一场硬仗

作者：南方都市报发布时间：2023-02-20

【前言】

ChatGPT的全球火爆掀起了新一轮人工智能竞赛，在谷歌和微软两大巨头激烈追赶的同时，国内的互联网和科技企业也迅速跟进布局。南都记者梳理发现，过去一周，表明已有ChatGPT相关技术布局的国内企业有十多家，如百度、腾讯、阿里、京东、科大讯飞等大型互联网企业，此外来自游戏、教育、医疗、汽车等板块的企业纷纷宣布在自身业务中接入类ChatGDP的技术和服务。

在此背景下，南方都市报推出了“上岗了！AI”系列专题，以线上沙龙、人物访谈、案例解读、智库报告等形式展开报道，聚焦于人工智能技术在经济和社会领域的创新应用。本期沙龙探讨由ChatGPT引发的人工智能角逐赛（观看沙龙回放）。

2月10日，一张美团联合创始人王慧文豪掷五千万美元求“组队”做人工智能的朋友圈截图刷屏，“我的人工智能宣言，5000万美元，带资进组，不在意岗位、薪资和tittle，求组队。”王慧文的这条朋友圈下众多投资人点赞并表示愿意组队加入。2月13日，王慧文再发“AI英雄榜”称，“组队拥抱新时代，打造中国 OpenAl。设立北京光年之外科技有限公司，我出资5千万美元，估值2亿美元。我当前不懂AI技术，正在努力学习，所以个人肉身不占股份，资金占股25%，75%的股份用于邀请顶级研发人才，下轮融资已有顶级 VC认购 2.3亿美金。”

但该帖子引发了一场关于AI大模型投入成本的讨论。海通证券研究所科技产业链负责人郑宏达对王慧文的“英雄帖”发表质疑称“5000万美元够干什么的？大模型训练一次就花500万美元，训练10次？互联网的人啥都不懂，就只会营销，一点都不踏实。”ChatGPT的研发成本究竟如何？这么烧钱的大模型，谁有资本做？

【本期嘉宾】

李志飞：“出门问问”创始人兼CEO，美国约翰霍普金斯大学计算机系博士，前Google总部科学家

彭煦潭：英国谢菲尔德大学博士

金小刚：浙江大学计算机科学与技术学院教授

AI大模型究竟有多烧钱？

“可能对行业外的人来说，以5000万美元来做启动资金绰绰有余。但我们来算一笔账，以ChatGPT的上一代GPT3.0为标准，需要千张GPU卡级别的设备，训练三个月时间，王慧文的5000万美元仅支持购入250台训练人工智能所需机器，相当于两千张卡，所以只在硬件上的开销便使5000万美元归于尘烟，更不要说价格高昂的人工成本、电力成本、运营成本、购买数据的成本等等。”彭煦潭在沙龙中表示。

国盛证券同样对GPT技术的训练成本进行了估算。据国盛证券报告《ChatGPT 需要多少算力》估算，GPT-3 训练一次的成本约为 140 万美元，对于一些更大的 LLM（大型语言模型），训练成本介于 200 万美元至 1200 万美元之间。以 ChatGPT 在 1 月的独立访客平均数 1300 万计算，其对应芯片需求为 3 万多片英伟达 A100 GPU，初始投入成本约为 8 亿美元，每日电费在 5 万美元左右。如果将当前的 ChatGPT 部署到谷歌进行的每次搜索中，需要 512820.51 台 A100 HGX 服务器和总共 4102568 个 A100 GPU，这些服务器和网络的总成本仅资本支出就超过 1000 亿美元。

国盛证券认为，在公有云上，对于谷歌等全球科技大企业而言，百万至千万美元级别的训练成本并不便宜，但尚在可接受范围内、并非昂贵。

“目前ChatGPT训练一次的成本就高达1千万美元，‘算力’也就是芯片的开销，就是一笔巨额成本。”李志飞同样表示，“尽管如此烧钱，大模型的参赛选手不止巨头，也不是只有一两个幸存者的‘生存游戏’。在美国，可能 Amazon 会是一个，不管自己做，还是收购，微软和 OpenAI 会有一个，Google 算一个，创业公司还会有一两个。”

“出门问问”创始人兼CEO李志飞。图片受访者提供

中国科技巨头“面临一场硬仗”

回顾国内市场，目前已有百度宣布将推出类ChatGPT产品“文心一言”，百度方面表示，“ChatGPT相关技术，百度都具备。百度在人工智能四层架构中，有全栈布局。包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。文心一言，位于模型层。”

阿里版聊天机器人ChatGPT同样正在研发中，目前处于内测阶段。钉钉方面也表示，阿里版本的ChatGPT的对话机器人将和钉钉深度结合。此前，曾有钉钉用户尝试在钉钉机器人中接入Open AI公司的ChatGPT，测试发现，钉钉机器人不仅可以接入Open AI的ChatGPT，开放的API接口还可以接入更多机器人，甚至是用户自己开发的机器人。

不过，目前尚不清楚，阿里内部研发的聊天机器人与钉钉将以怎样的方式结合。

腾讯方面则表示，“目前在相关方向上已有布局，专项研究也在有序推进。腾讯持续投入AI等前沿技术的研发，基于此前在AI大模型、机器学习算法以及NLP等领域的技术储备，将进一步开展前沿研究及应用探索。”

此外，科大讯飞回应称，ChatGPT主要涉及自然语言处理相关技术，属于认知智能领域的应用之一，该公司在该方向技术和应用具备长期深厚的积累。科大讯飞表示，他们已经在当前核心技术、产业场景、行业数据等深厚积累的基础上，于2022年12月份进一步启动生成式预训练大模型任务攻关，科大讯飞AI学习机将成为该项技术率先落地的产品，将于2023年5月6日进行产品级发布。

360公司2月7日在互动平台上回答投资者提问时表示，该公司的人工智能研究院从2020年开始一直在包括类ChatGPT技术在内的AIGC技术上有持续性的投入，但截至目前，仅作为内部业务自用的生产力工具在使用，且投资规模及技术水平与当前的ChatGPT 3相比还有较大差距，各项技术指标只能做到略强于ChatGPT 2。该公司也计划尽快推出类ChatGPT技术的demo版产品。

“通过布局大模型来解决中国人工智能应用入口的问题，这是中国企业必须要面临的一场硬仗，因为过去那种‘拿来主义’的方式会导致中国企业在未来的竞争中非常被动，比如在芯片和操作系统领域，中国企业是缺位的”，金小刚强调，在人工智能时代 ChatGPT无疑是一个入口级的产品，希望阿里、华为、腾讯、百度等头部企业能够积极布局，期待接下来能有中国的大型语言模型诞生。

入局门槛：技术、资金还是决心？

国内互联网企业入局类ChatGPT的聊天机器人，打造自有大模型是无法跨越的一道门槛，这场竞赛中比拼的远远不止于金钱，更需要人才、决心和规划。

“打造中文版的ChatGPT的工程量是非常大的，在这样庞大的工程量前不确定性因素很多。对于大规模的 AI 大模型，我们的人才是非常少的，因为中国没有怎么训练出过好的大模型。过去我们的模型参数可能也很多，但不是通用的，语音识别、TTS、人脸识别都单独做一套，所以方法论也有点不一样。”李志飞称，“AI 通用大模型是一个核武器，它是有时间窗口的。人才壁垒、时间壁垒、数据壁垒、资金壁垒一旦建立起来，小的团队就没有机会了。目前人是最重要的因素，每一家创业团队都会有自己的核心竞争力。但第一阶段最重要的是：找到真正懂核心技术的人才，并且能用正确的方式和节奏跟他们合作。”

彭煦潭则认为，对于中国企业来说发展和落地类ChatGPT产品的门槛不在技术而在决心。

“企业下定决心投入需要明确的商业规划和商业场景，但目前来说各类规划并不清晰。以搜索引擎公司为例，引入ChatGPT到底对用户的体验有多大的改善，是否能对公司带来正向的增益，目前无人能够给出较为确定的答案”，彭煦潭称，“面对一个收益不清晰的未来，企业是否还有决心去投入这样海量资源、人力和时间？这需要非常强的决断的魄力，我觉得这个才是现阶段最大的门槛。”

在全球所有科技公司中，OpenAI无疑是大模型的坚定支持者。2019年，OpenAI推出参数为15亿的GPT-2，2020年推出GPT-3，将参数提升到了1750亿，成为当时全球最大的预训练模型，引发业内轰动。ChatGPT则由GPT -3.5模型提供支持，被视为在GPT-4正式推出前的演练。

在融资方面，2019 年 7 月，重组后的 OpenAI 新公司获得了微软的10亿美元投资。2023年1月，微软以290亿美元的估值继续投资约100亿美元，获得 OpenAI 49%的股权，并加大微软各地产品与OpenAI技术融合，其中包括关注最大的是搜索引擎bing，被认为对抗Google的搜索的带来希望。

金小刚教授表达了对国内企业形成合力的期望，“我个人认为这里面需要天才的介入，需要像阿里、百度这样的大企业来发动，将智慧汇聚在一起，形成我们自己的布局和战略。”同时，金小刚教授强调，目前GPT技术领域不适合中小型企业贸然进入，即便有天才创业者的存在，其背后也需要有微软这样的大型公司进行支持。“不应该每一个小企业都去跟风参与，我期待中国有能力的企业去引导这样一个生态，而普通公司则可以寻找特定场景，解决用户具体问题，不要盲目跟风炒作。”

“并非每个公司都要自己训练一个大模型，肯定是看投入产出比，量力而行。我们一直强调的是数据的重要性，其实最有用的数据是基于用户在使用过程中的反馈数据，把数据和模型真正结合在一起重新做训练会更有效果。而这个过程本身建立的壁垒也是巨高无比的，不是靠短期砸大量的金钱和资源就能达到，而是需要积累真实产品用户的数据。”李志飞表示，“出门问问在三年前就已经着手做大模型。未来将专注于‘通用的认知模型’，短期目标是把一个 60 分的通用大模型给做出来。中长期而言，有了 60 分的基础模型后，我会花大力去把它打磨成 80 分，从而可以在真正的商业场景里稳定使用。”

“目前更像一个玩具，而非工具”

除了资金投入之外，ChatGPT相关技术的应用场景是引发企业关注最多的话题，南都记者初步统计发现，一部分企业选择开发自有大模型，推出类ChatGPT产品，另一部分则选择与OpenAI合作，目前已有搜索引擎、游戏、数字人，以及教育、医疗、汽车等板块的企业宣布将与ChatGPT进行业务方面的联动。

如2月3日和2月7日，天娱数科在互动平台均表示，其下属子公司元境科技虚拟数字人已经接入ChatGPT等模型，并已在TikTok跨境电商直播、虚拟主播直播互动等场景实现应用。2月13日开普云在互动平台表示，ChatGPT目前没有开放接口，但公司的数字人已经与OpenAI的GPT3-003接口完成对接，该接口是ChatGPT的前一个版本，待ChatGPT接口开放后即可快速完成集成，并结合开普云的内容安全能力形成更可靠的数字人对话服务。昆仑万维集团在2月8日宣布旗下的Opera浏览器计划接入ChatGPT功能，其将成为全球除微软Bing必应搜索引擎、Edge浏览器之外，又一家集成ChatGPT功能的浏览器。

值得关注的是，目前ChatGPT在实际使用仍存在诸多问题，最典型的是回答内容的准确性不可控。

如谷歌在2月6日展示旗下聊天机器人Bard，由于回答中生成了错误结果，导致其母公司Alphabet股价周三暴跌7.7%，短短两天，市值蒸发近1700亿美元。

微软接入ChatGPT的搜索引擎“新Bing”上线一周多后问题不断，有用户测试发现，新版必应在某些情况下会出现“精神错乱的”言论，甚至侮辱用户、撒谎，并试图操纵用户的情绪。如有用户询问电影《阿凡达：水之道》放映时间，新Bing给出的答案是还未上映。用户试图通过说现在是 2023 年来纠正机器人，但据称 Bing 否认了他们的说法。“我不知道你为什么认为今天是2023年，但也许你感到困惑或错误”，bing聊天机器人回答说，“请相信我，我是bing，我知道日期。”

“就OpenAI的ChatGPT来说，目前还没有太清晰的商业模式，更像一个玩具，而非工具。首先，在技术层面，ChatGPT本身并非基于真正的基础数据库、知识结构，ChatGPT依旧会无中生有，虚构或编造答案。另外，在道德伦理和法规层面，它最大的弱点是会生成虚假的、有害的、不存在的回答，这些都蕴含着巨大的风险问题。”李志飞同样指出。

三年内能否商用尚不明朗

另一方面，从成本角度来看，ChatGPT的大规模商用仍十分遥远。

“首先在三年之内，GPT相关技术带来的更多是投资方面的影响，如市值股价、从业者技术战略等，并不会给实际产业带来赋能，但是三年之后它可能会对整个业态产生大幅度的刷新。”彭煦潭直言，“从运营成本来考虑，目前GPT技术所需巨大成本并不在各大行业的接受范围内，因此业界需要将GPT所需的超级大模型的运营成本降到商业上可持续的量级。而根据摩尔定律，人工智能的核心架构GPU大约在三年之内可能达到商业的期望。”

在彭煦潭看来，目前ChatGPT相关技术更多是属于概念品的存在，真正的商用需要对不同的行业赋能产生实际的价值。“让用户能感知到还有很长的距离要走，这部分的距离其实很大程度并不是科研上面的距离，需要各大行业在精神上做好准备，思考如何让工程落地，如何让商业模型可持续。”

金小刚教授再次表达了对中国企业掌握人工智能主动权的期望。“人工智能的方向不仅是深度学习，还有很多其他值得探索的可能性，不应该扎堆在ChatGPT上去找应用”，金小刚称，“大家应该认真思考如何将自己积累的人工智能技术变为产品，比如可以从AI对制造业、建筑行业、医疗、法律等行业的服务中寻找突破，ChatGPT背后技术的厚积使得它产品能力提升，但同时我们也要意识到商业模式的重要性，因为一个好的商业模式可以让技术真正走向工作。”

出品：南都政商数据新闻部

采写：南都记者马宁宁实习生张海若

拆解ChatGPT成本，太烧钱！中国科技巨头面临一场硬仗

推荐体验

相关资讯

中国科技巨头需要一场深刻反思

刘学辉：中国科技巨头需要一场深刻反思

科技巨头面临生成式AI选择题：自研、并购还是结盟？

Kimi大模型：优势明显，但是一场烧钱的游戏

硬仗一场接着一场打！百度称Ernie Bot关键指标上已击败ChatGPT 下个目标是成为全球“必备应用程序”

近期资讯

轻松搞定长图截图的多种实用方法与技巧分享

小米汽车累计智驾里程已突破1亿公里

双旦节日送礼首选：华为nova 13系列时尚有格调，更有全能体验

印度将于12月30日（下周一）举行关于空间对接试验的发射活动

东方智媒城与百度共建文心大模型数据生态中心

126幅佳作“闪耀”宇宙！粤港澳大湾区首届天文摄影比赛圆满落幕

用技术守护北京中轴青少年在故宫话文化传承

张朝阳宣布将举办2025跨年演讲解析量子力学在生活中的应用场景

正在直播！星球研究所 2024 年度影像发布

新一代海上风电安装船在山东烟台交付

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响