古典互联网创业者的“第二春”：让大模型先跑一会儿

作者：商业与生活发布时间：2023-04-21

阿里巴巴百度华为腾讯商汤

©商业与生活文｜朱晓培

校对｜大道格

“今天真正是一个在技术领域，对未来10年、20年形成重大历史契机的关头。”

4月11日，阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇现身2023阿里云峰会现场。这是他躬身入局进入到云的战场后的第一次公开演讲，也是疫情开放以来的中国互联网的第一此大型活动。

活动现场摩肩接踵，主论坛坐满了，直播间坐满，工作间也满了，挤不进去的人们就围在走廊的大屏前观看直播。而同样热闹的现象，也出现在了一周之后的火山引擎的原动力大会现场。

人们风尘仆仆的从四面八方赶到现场，都在关心同样的问题：如何重回增长？如何看待正如火如荼的人工智能（AI）浪潮？

过去两个多月，因为ChatGPT的走红，中国互联网科技领域一改近两年沉闷的氛围。从已经久居幕后的互联网连续创业者，到互联网大厂，各个摩拳擦掌，都期望在AI浪潮中寻得一席之地。

看起来，以大模型技术为代表，新技术带来的效率革新就在眼前。在这样一个风云变幻大时代场景下，所有的人都热切的想知道，这个AI浪潮，对中国的经济，乃至对中国科技的未会带来什么？

大模型大爆发

自2月10日，王慧文发布自己的AI宣言以来，在中国创投界一向雷声大、雨点小的AI领域，突然如老房子着火，一发不可收拾。

据不完全统计，仅过去一个月内，国内已经或者即将内测的大模型就有百度文心一言、阿里通义千问、华为盘古、腾讯混元、昆仑万维天工、商汤日日新SenseNova、AI创业公司Minimax、360大语言模型、出门问问序列猴子等等。此外，火山引擎发布了大模型训练云平台。小米雷军也按耐不住在微博上表示，对于大模型，将“全力以赴，坚决拥抱，正在研发一些有趣的技术和产品”。

这轮由ChatGPT引爆的技术热潮，经过了三个多月的发酵，就在国内迎来了第一轮爆发。密集的发布会，让从业多年的老媒体人也感慨，职业生涯少见。

出门问问CEO李志飞说，自己在去年12月就开始了大模型的开发，总觉得自己应该是国内第一个发布大模型的，但没想到百度的文心一言、阿里的通义千问等都抢在了前面。

随着互联网大厂纷纷躬身入局，形式似乎也越来越明朗——ChatGPT 开启了通用人工智能（AGI）时代，而大模型是目前看来通往 AGI 最靠谱的实现方式。

“ChatGPT 给了我非常强的震撼，它特别有意思的是，无论你如何‘调戏’，它都能给你答案。”李志飞说，之前，他对AI大模型持怀疑态度，想不通可以用来做什么；但GPT-3 发布后，他觉得AI什么都可以做了。

“人工智能技术全面的爆发，和新一代技术的出现，和可能带来的对各行各业颠覆性的影响，和时代的机会，让我们看到了一个全新的数字化时代后智能化时代的到来。”阿里张勇认为，所有行业、所有应用、所有软件、所有服务都值得基于新型人工智能技术、基于AIGC各方面技术支撑、大模型支撑重做一遍。“这一定能带来不仅是一种创新性的客户体验、客户服务满足，同时也会让我们的生产范式、工作范式、生活范式发生很多变化。”钉钉总裁叶军也率先表示，“用大模型重做一遍钉钉，我们的决心是非常大的。

李志飞也持相似的态度，“AGI一定会对这个时代产生重要影响，未来五年，我看不到任何一个行业不会被大模型影响。无论是什么行业，包括物流、供应链、硬件等各种看起来和大模型没有直接关系的行业，都将受到影响”。

古典互联网创业者重新扎堆

“因为GPT，一批古典互联网创业者又重新扎堆了。”一位资深媒体人、创业者在加入了一个AI创业群后，发现群里大部分人都是老朋友——都是一些连续创业者，有人还做过一两家上市公司，但前两年又处于退休的状态，比如王慧文、王小川。

既然连张勇都认为，在大模型面前，大家都在同一起跑线上，那么古典互联网创业者的激动，也就在情理之中。

弗洛伊德曾提出过一个名词——“穷人精神官能症”，指经济快速发展的过程中，除了少数几个“赢家”外，还有一群人（仍是少数）虽然经济状况已经在普通人之上，但却对现状既不满意，一遍觉得自己赚得还不够，另一边有喜欢对外说自己对钱没兴趣。这种“症状”其实同样适用于创投领域，特别是小有成绩的创业者，更渴望巨大的成功。

“你遇到超越工业革命的这么一件事儿，肯定会去思考，要做点什么?”正如宝宝树创始人王怀南所说。他对《商业与生活》表示，无论是宝宝树这一端，还是在银发事业这一端，大模型的出现，让自己都有巨大的机会可以革自己的命。眼下，他也正在筹备自己相关的创业项目。

但最激动、最积极的，莫过于搜狗公司创始人王小川。虽然他比王慧文晚了两个月才宣布进入大模型领域创业，但一入场就接二连三的接受了多家媒体的采访。

据王小川自己爆料，他新创办的百川智能，以前搜狗团队为基础，还拉拢了百度、华为、微软、字节、腾讯等知公司以及其他创业公司核心成员在内的数十位顶尖AI人才。而公司目标，也在王慧文“组建中国版OpenAI”的基础上，又增加了“打造颠覆性上层应用”。

王小川在接受媒体采访难掩兴奋，他说，“通用人工智能时代刚刚开启，我们作为第一批跨入新时代的人类，带着焦虑和好奇去拥抱它，思考和探索‘我是谁？’我们还可以把自己的智慧注入它，做新时代的开创者，让后代们有一个更美好的未来，繁荣和延续人类文明。”

不过，他可能忘了，一年半前，他曾在宣布卸任搜狗CEO的内部邮件里宣布，往后二十年，要在生命科学和医学领域再出发，为大众健康做贡献。毕竟，大健康这个领域的风口，随着疫情的结束已经落了下去。

当然，连续创业者成为为大模型摇旗呐喊的主力，还有一个原因，大模型烧钱。根据国盛证券报告《ChatGPT 需要多少算力》估算，GPT-3 训练一次的成本约为140万美元，对于一些更大的 LLM（大型语言模型），训练成本介于200万美元至1200万美元之间。李志飞也表示，“目前ChatGPT训练一次的成本就高达1千万美元，‘算力’也就是芯片的开销，就是一笔巨额成本。”

此前，王慧文豪抛出5000万美元招募大模型人才时，还被外海通证券研究所科技产业链负责人郑宏达质疑“5000万美元够干什么的？”因此，这也不是像以往的电商、社交甚至O2O项目那样，是普通打工人就可以想的事情。 但对于那些手握大量现金，又处于隐退状态的连续创业者而言，这确实一个难得的好机会。

王慧文说，自己本来想搞个基金，去投最前沿的科研。因为前沿科技的投资，打水漂的比例很高，名字都想到好了，就叫傻瓜资本。但是，还有句话说，投资别人，不如投自己。

做大还是做小

从技术的角度来看，大模型发端于自然语言处理领域，以谷歌的BERT、OpenAI 的GPT 为代表。这两个大模型越跑越大，目前参数规模逐步提升至万亿，随着用于训练的数据量级也显著提升，模型能力的提高。

但其高深莫测的AI能力，也引发了业界的担忧。

此前，包括马斯克、图灵奖得主Yoshua Bengio、苹果联合创始人Steve Wozniak等多位科技界知名人物签署了一封公开信，呼吁在6个月内暂停开发比OpenAI公司新推出的GPT-4更为强大的系统。

公开信被曝光后，引发了更多的人开始关注、反思AI背后的安全性问题。目前，欧洲多个国家已经掀起了对ChatGPT的监管行动。而ChatGPT也从人工智能的宠儿，开始变成需要“锁在笼子里的巨兽”。

身处风暴中的OpenAI公司CEO山姆·阿尔特曼（Sam Altman），在近日的麻省理工学院的公开活动上，对公开信做出回应称：“我非常同意其中的部分内容。我们完成对GPT-4的训练后，花了6个多月的时间，研究大模型的安全性……我也同意，随着AI能力变得越来越强大，安全标准必须提高。”“现在并未训练GPT-5，在短期内也不会训练。”

与OpenAI一开的策略不同，国内大模型普遍选择从B端起步。从目前的信息可以看到，企业都在思索如何将已有的大模型规模 “做小”，以更小的参数，做更有效率、更适合垂类的场景。

比如，华为盘古大模型，就将重点发展细分场景的落地为煤矿、水泥、电力、金融、农业等。

阿里通义千问目前也已改造阿里生态内的产品为主。而百度对文心一言的定位也同样偏向B端，主打为金融、能源、媒体、政务、医疗等行业赋能。

把大模型做“小”，有几个好处。

首先，技术上，GPT-4已经接近了LLM（大语言模型）的极限。山姆·阿尔特曼说，“我认为，我们已经走到了这个时代的尽头，我们将以其他方式把这些大模型做得更好。”“如果可以的话，参数数量应该随着时间的推移而减少，或者我们应该让多个模型一起工作，每个模型都更小。我们希望向世界提供的是最强大、最实用、最安全的模型。”

其次，是省钱。众所周知，大模型参数越大，训练花费越高。使用的人越多，耗费的算力越高。在商业化模式还不明朗、开源节流仍是时代主题的当下，一昧的做大，让大模型成为人们“调戏”的对象，在商业和技术上并没有太大的意义。

挖矿或者卖铲子

当别人都去挖金矿的时候，稳赚不赔的一定是卖铲子的人。要做大模型，则离不开算力这个“铲子”。

根据国盛证券的报告，以 ChatGPT 在1月的独立访客平均数1300万计算，其对应芯片需求为3万多片英伟达A100 GPU，初始投入成本约为8亿美元，每日电费在5万美元左右。如果将当前的ChatGPT部署到谷歌进行的每次搜索中，需要512820.51台A100 HGX服务器和总共4102568个A100 GPU，这些服务器和网络的总成本仅资本支出就超过1000亿美元。

大模型训练非一日之功，想要入局大模型，拥有大算力是必备条件之一。市场上流传的调研纪要显示，要训练像ChatGPT这样的生成式AI，至少需要1万张英伟达A100加速卡的支持。目前，国内只有6家公司具备这样的硬件实力。更不要提后续，随着模型扩张、场景落地，算力需求还会进一步增加。

换个角度而言，不论大模型未来走向何方，“算力”都将会是受益的那方。因此，腾讯、阿里以及字节，这些本身就拥有云服务的企业，一边加自研大模型，一边开始抢夺算力市场。

4月14日，腾讯云发布了面向包括自动驾驶训练、自然语言处理、AIGC大模型训练等大模型训练的新一代HCC（High-Performance Computing Cluster）高性能计算集群。

火山引擎总裁谭待则表示，火山引擎将全面基于DPU构造大规模算力中心，形成DPU+CPU+GPU的混合算力体系。并强调，“除了自研能力带来的极致性能以外，通过规模化优势为客户带来更多“实惠”也是火山引擎一直努力的方向。“

“（阿里云对）智能化时代的到来已经准备好。”张勇说，云计算、人工智能爆发的发展，首先需要一个几何级速增加的算力支撑。而阿里云经过这么多年的建设形成了全栈的技术服务，未来工作的一个重要方向就是“算力普惠”。

张勇让阿里云的同事把过去10年云计算服务最重要的两个价格，发现算力服务降了80%，存储服务降幅则接近90%。但未来，他希望中间算力的成本能达到今天的1/10，乃至1/100。

巨头大力布局算力市场，看起来也是一个双赢的局面。

具体来说AGI需要靠给用户提供有价值的服务来商业化，并且利用用户对服务的反馈来持续的提升，我们坚持做AGI原生应用，这些应用本身就是“User--in-the-Loop”的系统。过去的几个月里，这个系统平均每天与用户产生近亿次的互动，并在互动中持续提供更好的服务体验。

“对于一家创业公司来说，我们无法在一开始就拥有大量的算力，但是我们非常幸运的发现，中国的公有云市场已经积累了，大量的算力和经过验证的基础设施。”MiniMax联合创始人杨斌说。MiniMax是依托火山引擎机器学习平台，研发的超大规模的大模型训练平台。

杨斌感慨，一年多前，作为一家AGI初创公司说要研发大模型，几乎是天方夜谭。但今天，随着GPT热潮涌动，技术如何启动，产品怎么做，算力从哪里来？这三个问题都不再是大问题了。

谁是中国的OpenAI?不重要！

目前，业内普遍认为，国内的大模型与OpenAI仍有差距。

李彦宏说，“如果全面来评测的话，文心一言确实也不如现在最好的 ChatGPT 版本，但是差距不是很大。所谓不是很大，可能就是一两个月的差别。”

王小川在接受媒体采访时则表示，差距极大，在生成式人工智能领域美国“比我们领先3年时间是有的”。

李志飞则给了一个折中的数据，“国内模型水平大概处于FLAN阶段，比GPT4晚16个月。”

因为，差距到底有多大，王小川与百度还暗戳戳的互怼了起来。而互怼的背后，则是都想宣称自己是中国的OpenAI。

王小川在接受媒体采访时说，年底要做出国内最好的大模型，对标GPT-3.5的大模型。但百度集团副总裁、搜索平台负责人肖阳暗示：王小川脱离一线太久，对国内人工智能技术的发展缺乏了解。“我们当然非常希望中国如果能够跑出一家像OpenAI一样的公司。但是怎么说呢，当年搜狗也立志取代百度，结果也是显而易见。”

但实际上，现在谁是中国的OpenAI这件事，正在变得不重要。就像张勇所说的，“不管谁做了大模型，不管谁做了什么样的模型，不管谁做了专属模型，今天我们畅想未来，10年以后、20年以后回过头来看这段时间，其实我们所有的企业都在同一个起跑线上。”

而且，随着越来越多的公司发布自己的大模型，并找到相应的行业切入。越来越多的业内人士开相信，未来将会是多种模型共存的局面。阿里也表示，通义千问是为用户提供了更多一种的选择，“我们也希望在阿里云的平台，在云的基础设施平台上，不仅有阿里的通义大模型，同时也有跟高校、科研院所、各行各业合作的基础大模型。”

“就像多云是既成事实一样，多模型也一定会是未来趋势，多云多模型是长期的IT格局。”火山引擎谭待说。

即使是最先提出要做中国的OpenAI的王慧文，再键入AGI领域两个月后，也有了不一样的认知。“这个事情还是有非常多要探索的东西。不到最后一天，AGI这个事情谁做成还不好说，你凭什么认为一定是OpenAI先于我们做成？它们只是现在领先而已。”

让大模型再跑一会儿

回看王慧文2月的AI宣言，就像在干草堆里点了一把火，让中过的互联网公司热闹了起来。这里面，固然有蹭热度、赶潮流的，但对于云计算来说，其实也是厚积薄发、水到渠成的结果。

尽管有一些人质疑GPT又会是一场技术泡沫。比如吴军就撰文称，ChatGPT被过度的炒作了，“不算新技术革命，带不来什么新机会 ”

但是，技术泡沫也有泡沫的好处。财经作家迈克尔·刘易斯在《为经济繁荣辩护》一文中提到一个观点：每一次技术泡沫，都会让社会受益。

无论你对繁荣有什么看法，不可否认的是，它会让人们不停地忙碌。资金会以工资的形式流向社会，更多的年轻人会因此受到技术训练，并拥有了创业欲望；企业家会产生更多有趣的商业想法，这些想法或许看起来是超前的，但说不定有一天就与时代保持一致了。哪怕竞争看起来是一地鸡毛，就像第一次互联网泡沫破后数百万英里长的冗余光纤，当时看起来有点儿浪费，但今天又在人们生活中扮演着重要的角色。

我问王慧文，“各种大模型的密集的出货速度，有没有出乎你的意料？”他答道，“还好吧。”

不同于之前做美团，看谁都是对手，忍不住想刻薄两句。王慧文说，看AI领域的从业者，勇于踏上这条路的人都是勇士，需要的是同舟共济。而张勇也说，如何抓住未来的机会，是大家共同的愿望，也需要一些共同的合作和努力。

更何况，科学技术的发展，不是积累式的线性的，而是跳跃式的，一经突破将迅速展开，就会另辟蹊径进入一个新的世界。因此，不妨让大模型先跑一会儿。

—End—

推荐阅读

蛰伏三年，王慧文为何为OpenAI心动？

颠覆性创新年代，手机企业靠什么穿越周期？

阿里巴巴：一家好公司必须具备的三个品格

拼多多：为何热衷于讲农业的故事？

66.8万吨，二手为什么拯救世界？

重估平台价值，关键要素仍然是“人”

风起循环电商，红布林做对了什么