ChatGPT一周年，机会在大厂还是小公司？

作者：略大参考发布时间：2024-01-18

大创新靠小厂、小创新靠大厂。大厂的体量也会有大模型，只要增加1%就是巨大的受益。但是最大的创新可能来自于创业公司。新的一波机会，从信息时代走向智能时代，会有新的公司起来。

作者|小葵尹凯

编辑|原野

ChatGPT 会成为AI大模型的“iPhone 时刻”吗？

在这款改变了全球AI行业进展的大模型上线一周年之后，答案显然更加明确。GPT数次进化迭代，大模型浪潮席卷全球，AGI俨然有引导第四次工业革命之势，也验证了OpenAI首席科学家伊利亚的那句话：这是倾盆大雨前的一场雨，是一个分水岭。

更深入更细微的变化还在继续。

“在未来两三年内，我们的工作方式、生活方式会有天翻地覆的变化。”百川智能创始人、CEO王小川在12月1日的2023腾讯ConTech大会中谈到。大会上，他与长江商学院教授、数字化转型中心主任孙天澍，以及复旦大学计算机学院教授、Moss系统负责人邱锡鹏，探讨了AI将在接下来的20年里如何重塑各个行业，其中，互联网大厂与创业公司又各自扮演什么角色。

01变化

从只能处理文字信息的网页端应用，到可以同时处理文字、语音和图像信息的超级应用，ChatGPT只用了一年。期间，出于对其进化过快的担忧，包括马斯克在内的科技界大佬曾经联名呼吁，要缓一缓。

但大模型的热潮已经势不可挡。OpenAI已经从最初的非盈利机构，变成估值900亿美元的超级独角兽。全球几乎所有的大科技公司都发布了自己的大语言模型，从谷歌、Meta到国内的腾讯、阿里、百度、华为等。

于是，关于大模型的产业机会、技术突破和未来展望，就成为上述三位嘉宾在2023腾讯ConTech大会探讨的重点。

比如，大模型浪潮究竟是互联网大厂的机会，还是新一代创业公司的机会？

王小川没有作出“二选一”的回答。在他看来，大模型行业里，大创新靠小厂，小创新靠大厂。因为大厂本身会拥有自己的大模型，只要增加1%就会带来巨大收益。创业公司死亡率更高，也更可能带来更大的创新。

回到问题本身就是，当大模型推动大的时代变迁，人类从信息时代走向智能时代，会有很多新的公司诞生，空间很大。

具体落到大模型在消费互联网C端的应用，王小川比较看好它在智能助理和娱乐游戏内容方面的前景。比如，成为人类的私人老师、医生和律师等，或者在娱乐游戏中搭建更加高级的“太虚幻境”，因为大模型采用的是底层语言引擎，能构造出世界观和真实世界中的物理逻辑、社会文化逻辑等。

在技术层面，不管是OpenAI正在筹备的GPT商店，还是Facebook或者百川这类技术公司陆续推出的开源模型，开放，都在成为更加明朗的趋势。

由此可能带来的改变是大模型的平民化。邱锡鹏提到技术栈方面的体现，即，围绕某个大模型形成比较大的生态圈，提供好的个性化、定制化服务。不过，这需要解决计算成本的问题——这也是大模型变成人类助手的巨大阻碍。

因此，在他看来，进一步压缩大模型，甚至创造出新的架构，降低计算成本，让所有人都能用得起。大模型“平民化”的过程，也蕴含着大量机会。

不过，很显然，不是所有人和公司都能在合适的时机、抓住对的机会。

根据王小川的观察，大模型目前处于泡沫期，一些拥有技术力量的公司倾向于训练自己的大模型，因此导致了百模大战、千模大战。数据显示，到2023年7月时，国内大模型数量达到130个，已经超过美国的114个。到年底，前者又更新到了238个。

但本质上，这是一种焦虑：个人怕失业，企业怕掉队。在王小川看来，现在很多算力是浪费的。当行业进入成熟期，少量企业会拥有自己的数据与场景，甚至训练出自己的模型去赋能行业，但多数企业通过调用就足够了。

在现阶段，他的建议是：克制欲望，不要着急训练自己的模型，而是先把市面上已有的模型用好，通过产品和市场，先验证自己的判断，把第一步走好。

不过，区别于AI技术在过去几十年里的任何一次爆发，人类对于AGI的态度更加热烈，也更加谨慎。根据OpenAI首席科学家伊利亚的说法，这是因为AGI区别于人类迄今为止创造的所有东西，它具有自己的目标，完全自主。

AGI自身，以及人类围绕AI技术的研究的飞速迭代，决定了AI行业的这场狂飙，也决定了，身处其中之人，必须时刻进行自我迭代。

王小川在ConTech大会中谈到了自己的观念变化。

他原本有个观点：理想上慢半步，落地上快一步。相比技术科研，中国的优势可能在应用层面。但今年6月去美国与大模型同行们交流后，他改变了，想要：理想上慢一步，落地上快三步。

一方面，拥有7年积累的OpenAI在技术层面已经领先太多。比如OpenAI现在正在进行的研究是，尝试把1000万颗GPU连在一起训练一个大规模的模型，而国内现在还在4000颗GPU对标GPT-3.5的阶段。不过，在应用层面，中国互联网的产品体验远强于美国，移动互联网时代也培养了大量优秀的产品经理，这些都是优势。

一句话就是：更加彻底地扬长避短。

02狂飙

王小川的观点，或许也是多数大模型创业者的心态缩影：在月亮与六便士之间，优先选择后者。

毕竟，先活下来，才有机会参与到后面的故事。

苹果公司在移动互联网时代建立起来的供应链与生态王国，成为很多还在路上的大模型中国创业者的“灯塔”。仅仅在A股，苹果产业链上市公司就有118家，“苹果吃肉，供应商喝汤”的说法广为人知。更不用说，那些通过做一款APP而改变人生轨迹的海量创业者们。

目前来看，Open AI很可能成为新时代里的苹果公司——就连创始人被驱逐出董事会再回归的桥段，都如此相似。就算它无法复制苹果的成功，微软和谷歌也足够有野心。

在中国创业圈，AI狂飙的剧情正在上演。

今年以来，多家大模型初创公司拿到融资，企名片数据显示，今年中国AI领域融资214亿元，百川智能、Minimax和智谱AI三家公司在资本市场尤为受欢迎，融资额占比超过30%，基本形成第一梯队。

图：人工智能领域该周内融资6起，融资金额21.73亿元。其中，在10月17日，百川智能完成3亿美元的A1轮战略融资。

以成立于今年3月的百川智能为例，它在天使轮拿到5000万美元，AI轮拿到3亿美元，参与方包括阿里、腾讯、小米和多家头部投资机构。

陆奇创办的奇绩论坛，成为这波AI浪潮的缩影。根据《中国企业家》报道，在今年的秋季路演日上，67家创业公司参与，其中51家为人工智能领域。更早些时候的春季路演日，人工智能和大模型相关创业项目为82个，超过总项目的一半。

更多明星人物在AI大潮中变得炙手可热。比如创立光年之外的王慧文、创立百川智能的王小川。他们此前在互联网和移动互联网时代的履历已经足够光鲜，唯一的缺憾就是，尚未独自站在舞台中央。

如今，AI让一切成为可能。

王慧文曾经在接受采访时提到美国投资人埃拉德.吉尔的观点：在部分科技浪潮中，所有的价值都可以由初创企业捕获，而在另外的浪潮中，大部分价值会归成熟企业所有，或者会在初创企业和成熟企业之间分配。在王慧文看来，AGI浪潮属于后者。因为大模型的技术跟过去差异极大，市场具有不可预测性，创业公司就有了发展空间。

不过，类似这样的观点，还有待时间去验证。

创业者纷涌入局，实力更雄厚的大公司们，自然也不会缺席。

场景、数据、模型和算力，共同构成了大模型的四要素，这也意味着门槛——创业公司或许能擅长其中的一项或者几项，但想把它们尽可能多地集齐，显然还是大公司更有优势。根本上，这是关于科技的硬较量，需要大量资金与高端人才的投入。

整体来看，大模型在国内经历了三个阶段：今年3月起，百度、阿里、华为、腾讯、360等大厂陆续发布大模型；5月起，包括商汤在内的AI 1.0公司，以及知乎等中小互联网公司跟进；10月起，一批大模型进行迭代，部分国产大模型宣布开源。

至少到现在，大厂与创业公司们还没有形成泾渭分明的敌对阵营。狩猎、绞杀和反抗的戏码，还没有拿到出场的指令。更多时候，以及接下来的很长时间里，他们都需要彼此借力，争取在国内形成健康繁荣、且能持续相当时间的AI生态。

不过，人们在现实中感受到大模型赛道狂飙的影响，或许不需要等待太久。

在2023腾讯ConTech大会中，王小川给出的答案是“未来两三年”。他借用了孙正义的观点，“会用AI和不会用AI的人就像人和猴子的区别一样”，他相信，人们的工作和生活方式很快会因为AI而发生巨变。

变化带来机遇，也带来希望。

财经作家吴晓波在《激荡三十年》中写道：“这是最好的时代，这是最坏的时代。这是史诗，幸而你我活在其中，幸而未完。”对于AI时代，史诗的序曲或许刚刚奏起。

以下是2023腾讯ConTech大会相关访谈实录：

孙天澍：我们讨论的第一个议题是大模型的产业机会，AI正在以什么样的方式重塑产业，里面的机会在哪？接下来大模型在消费互联网C端的产品形态和商业机会有哪些？到底是互联网大厂的机会，还是新一代创业公司的机会？

王小川：大模型来了以后，无论是大厂还是创业公司、投资人都已经很疯狂开始发展这样的技术。我的看法是，大厂至少在现有的产品迭代升级里面有挺多空间，人员密集型的地方可以用大模型来做替代，也能够升级自己的产品。但是对创业公司而言，死亡率会更高。

行业之前做大模型，有一个概念叫做大创新靠小厂、小创新靠大厂。大厂的体量也会有大模型，只要增加1%就是巨大的受益。但是最大的创新可能来自于创业公司。新的一波机会，我们的看法是从信息时代走向智能时代，会有新的公司起来。

至于C端怎么用？大模型不是一个工具，它掌握了语言、世界知识等，起到了陪伴人类的伙伴角色。它也能成为各种各样的助手，比如写作助手、问答助手、私人老师、私人医生、私人律师等。

娱乐行业对于大模型同样有着巨大的需求。人类除了工作创造，也需要休闲，大模型在情感陪伴领域不仅可以拟人，甚至可以拟出一个虚拟世界。这将会给娱乐行业、游戏行业带来很大的变化。因此，大模型在C端里的两个重大方向分别是娱乐行业和助手。

孙天澍：小厂做大创新，大厂做小创新，但是大厂有自己的阵地，可以在已有的电商娱乐等方向、APP上进行升级。小厂可能会探索出一些全新的产品，全新的结构，这里面有非常多有意思的新一代的产业机会。想问一下邱老师，大模型在开放态度中的产业机会。整个大模型在开放生态发展非常迅速。第一，未来开源模型在海外，在中国会不会收敛到一到两个模型？第二，为开放生态进一步发展，大模型公司还需要做哪些准备？国内大模型公司需要在能力上做什么准备，能够达到像OpenAI和Agent智能体未来开放生态布局？

邱锡鹏：大模型生态变得非常开放，这里有非常多的参与者，涉及到平民化的问题。平民化可能分成两个：一方面，因为大家都在围绕着某个开源，围绕着比较大的生态圈，如果提供非常好的个性化、定制化能力的话，就是技术战，因为参与者众多，确实会降低很多研发成本。

现在，非常蓬勃的互联网生态发展包括GPT个性化、各种工具的使用、任务规划等，这些都需要比较大的模型。但由于大模型的算力成本和计算成本很高，存在一定阻碍。

目前来讲，由于成本的原因，国内还不能将大模型广泛地应用到每个人身上，让它变成每个人的助手。未来，如何去一步提升大模型的效率，把大模型进一步压缩，来降低它真正的计算成本，让每个人都能用得起，这才能达到真正的平民化。

孙天澍：请小川来分享一下，从大模型在企业服务未来的判断，对于企业家来说，想使用大模型能力，是应该思考用公有云上调、智能体结构，还是用自己的开源模型融合到企业知识库等，做更加私有化的部署？

王小川：开闭源场景里特别突出的矛盾问题是心态问题，大模型来了之后，全球人民都怕失业、企业怕自己掉队。这种情况下，有技术力量的公司，通常愿意训练一个模型出来，但这件事情并不够客观理性。现在正处于泡沫期，很多公司会愿意投资训练自己的模型。所以使得百模大战、千模大战，其实都是大家的焦感带来的。

事实上，到成熟期的时候，少量企业能够有自己的数据、场景，能训练出自己的模型给行业赋能，但是更多的企业通过调用方法就够了，挤掉泡沫后，才能沉淀出来大家的共识或者价值。

我给出的建议是，很多企业不妨克制一下欲望：不是先训练一个模型，而是先用起来，通过微软云、接口调用国内模型，将模型和业务链路融合起来。之后从产品、市场等方面验证可行性。

孙天澍：接下来问一下邱老师，您从研究者的视角，觉得整个大模型产业发展中，高校和研究者主要的角色和贡献在哪些方面？他们与大厂，与创业公司有什么不同？

邱锡鹏：我个人会更关注基础研究，现在大模型非常成功，它的推进速度比我们想象的更快，我和很多公司接触，发现他们底层已经都用大模型了，用大模型确实可以降低研发成本、标注数据等，它的广泛性确实非常好，可能比我们想象中还要更快。

但是做大模型和应用大模型，还是可以分开而谈。大模型还存在一些不足，包括如何做更高效果的架构、推理加速，训练加速等。如果面向未来智能体的发展，大模型仍然有很多模块欠缺，比如记忆能力、推理能力、规划能力等，包括现在大模型背后的一些机理，都不足以支撑未来更进一步推动智能化的发展。

作为学术界的人，我们更关注大模型的安全可信、诚实性等，争取让它更好地符合人类的价值观。

孙天澍：大模型时代来临后，人工智能要求人才的结构都很不一样，高校里有哪些培养机制？

邱锡鹏：以我们的经验来说，大模型需要全栈式的人才。应该是从底层的系统结构到模型如何训练，再到AI算法，甚至包括数据如何清洗都要懂。否则的话，中间会断，大模型研究上会比较低效。

孙天澍：中国大模型未来整个技术突破和核心竞争力会在哪些方面？在产品应用领域，中国的公司基于自己上一代的互联网经验，产品经验，以及基于中国大的消费市场，能不能做到全球领先？

王小川：我6月份去了一趟美国，跟OpenAI和其他做大模型的同行做了很多交流，发现我们要接受一个现实。OpenAI已经发展了7年，在这样的技术积累和场景布局里面，我们是有巨大的差距。

但是我们的产品体验是远远优于美国的，这里包括大家对于运营导向、贴近市场的方式等。我们要在这方面培养大量的产品经理，在这种情况下，我们有巨大的经验和优势。这里有两个难点需要解决，第一，要有模型，我们要将模型公司与应用公司结合，甚至用开来源和端到端的模式解决，争取用较弱的模型做出好的应用。

第二，产品经理也面临转型和提升。对产品经理而言，他们懂得什么样的产品适用于今天的技术，甚至还能引领技术的发展。产品经理要对技术有判断和评价，争取让算法工程师跟上这个步伐，解决这两个问题，中国的应用就能走在美国的前面。

孙天澍：想问一下邱老师，从基础研究的角度来看，第一，AI大模型的基础研究，怎么往更有效率的方式走？第二，计算机的研究、人工智能的研究，大模型对于整个自然科学领域的研究等，大模型可能会在哪些维度为技术突破、技术研究带来冲击和变化？

邱锡鹏：我们与OpenAI算力的差距太大，保持紧密的跟随。一方面能够锻炼我们的技术，另一方面保持不掉队，培养人才，能够达到非常好的效果。但是在赶超方面，还是要结合当前我国具体的实际情况，比如靠产业的带动，从中产生的需求，再把它转化到技术研究上。我们技术研究的问题，要由真实的需求凝练出来，所以产研合作在下一步变得非常重要。

现在的大模型或者以大语言模型为中心的新一代通用AI技术，是用语言来打底，构造一个非常完整的系列知识体系。很容易把人的各种经验通过语言作为载体附加到模型中，在做科学研究应用上的话，它的模式和形态可能跟以前不一样。它会更加侧重科研发现，类似于科研探索，或者主动让他得到一些新的结论。

孙天澍：关于技术突破还有两个很重要的话题，大模型四个要素场景、数据、模型、算力，想问大家对于中文语料进一步采集、整理和使用有没有什么建议？这个可以从你们自身企业发展的角度，或者模型发展角度，也可以从公共政策、产业政策的角度，谈一谈中文语料怎么样能进一步去采集优化？

王小川：主要分两部分，第一是训练大模型所需要的公有数据。第二是企业为了自己的竞争力需要的私有数据。我的逻辑就是不要迷恋于纯中文语料，需要高质量的语料都兼顾。至于企业自身数据，更多解决的问题是技术开放性怎么耦合到大模型里的问题。大模型核心靠的是预训练和最后的微调，企业语料怎么进去，需要技术实践，很多技术问题还在攻克当中，如何更好地把大模型跟自然语言、知识库之间对应上，需要工业界和学术界共同解决。

邱锡鹏：对学术界来讲，数据一直不擅长，我们这方面投入的人力不是很多，基本上以公开数据为主。但是这些公开数据经过一些粗加工，主要以英文居多，中文开放的还不够。我们需要提出数据的衡量标准，来评判什么样的数据是有价值的，包括知识量、知识推理等。

王小川：学术界还有特别被动的地方，因为学术界要通过发论文来证明自己的创新性，论文很多发在英文刊物里，如果学术界要努力做好中文数据，不代表可以在这个评价体系里获胜。所以我们的数据和评价体系，跟西方走了很多，这是特别被动的地方。

孙天澍：再提出一个方向的问题，在国内算力依然非常稀缺的情况下，如何在有限的算力下更好地用好这些算力资源或配置资源，对大模型的基础底座研究做出一些突破？大家能否从产业视角和学术视角做一个分享？

王小川：我认为企业有动力把算力做好，每个行业一旦被扶持，能有百家、千家公司做模型，这是一种很大的消耗，所以还是希望大模型对头部创新有更多帮助。

邱锡鹏：训练这块要适当集中，训练一个比较好的推理端，比如模型训练好之后，我们可以提升很多工作的效率，包括做一些优化、平民化的工作，这些都需要技术支撑。

孙天澍：最近一到两个月，你们有没有看到特别激动人心的大模型，赋能下一代的产品生态？或者是产品应用？

王小川：今年是元年，刚刚开始，在情感陪伴里面大家看到一些成绩。我们公司既做模型，也做应用，内部的医疗模型确实能够更好地做问诊，医疗能力还是蛮惊喜的。

邱锡鹏：我这方面了解的少一点，我觉得ChatGPT本身，还是比较惊艳的。因为他们个性化的速度非常快。

孙天澍：我觉得智能体是特别值得关注的一个方向，大家怎么看？

王小川：因为ChatGPT—4到了一定高度之后，智能体就变得非常可行了。国内还是有距离的，国内现在更大的基础工作一方面是追赶ChatGPT4的水平，这样才能做智能体。另一方面，追赶过程中，我们开始要做落地的应用。这样的视角会有些不一样。

孙天澍：大模型时代来临后，两位老师对年轻人有哪些建议？

王小川：时代变革的时候，年轻人更有机会。大家只需要用好大模型，就可以一个人变成一个团队，一个人做一个公司，这个机会是属于年轻人的。