中国需要“下一个OpenAI”吗？

作者：市界发布时间：2023-10-31

中国需要“下一个OpenAI”吗？

国内估值最快速超过百亿的大模型创业公司诞生了。10月20日，清华团队出身的大模型公司智谱AI宣布，今年内已融资25亿元。有媒体称，这家成立于2019年的公司最新估值已经超100亿元，最高或达到150亿元。

在公开的融资信息中，智谱AI的投资方颇为引人注目，包括了美团、阿里、蚂蚁、腾讯、小米、金山、顺为资本、Boss直聘、好未来、红杉资本和高瓴等。尤其是在大模型赛道上一直各自为战的腾讯和阿里，这次也联手投了同一家项目。

国内大模型创业，清华系撑起了半壁江山。智谱AI和清华大学的关系更为紧密。智谱AI成立于2019年6月，由清华大学计算机系知识工程实验室（KEG）的技术成果转化而来。公司核心团队中，CEO张鹏出身于清华计算机系，和公司总裁王绍兰均为为清华创新领军工程博士。现在智谱AI的不少研发人员，也曾参与过清华大学与智源研究院的合作的“中国首个+全球最大”悟道大模型项目。

大模型创业公司中，是否还能够诞生一个“中国版OpenAI”？面对互联网大厂们的资源和技术优势，创业公司们又要如何突出重围？围绕诸多问题，市界近期和智谱AI CEO张鹏进行了深度对话。

复刻“中国版OpenAI”并不现实

市界：智谱AI在2019年正式成立，第二年，OpenAI发布了GPT-3。在当时，你们就认识到大模型的研发会是未来的方向吗？在行业早期就all in到基座大模型的研发中去，并在2022年推出了GLM-130B，这中间智谱经过了什么思考？

张鹏：我们的公司是在2019年成立的。GPT-3发布时，公司刚刚成立一周年。其实之前我们就一直在关注这个事情，当时正值公司一周年的庆典，我们邀请了中国科学院张钹院士来参加活动，我们也讨论了要聊些什么，但大家的关注点还是放在了GPT-3上。

在早期，我们的团队就发布了名为AMiner的平台，用以做科研情报分析和数据挖掘，因此我们对于这件事的敏感度是非常高的。在2019年开始，公司就在做一些相关的算法研究，也是差不多沿着这个方向在做。GPT-3的发布，其实是给我们带来了一个信号：有人跑在前面了，这意味着，大模型的临界点终于到了。

市界：大语言模型预训练框架存在不同的技术路径，OpenAI选择的是GPT，谷歌选择的是BERT，作为一家创业公司，智谱为什么不用现成的，而是花大力气自研GLM架构？

张鹏：一方面是出于技术探索和理论研究层面出发，我们是一直在关注这个技术，自己也有一些积累。GPT这个框架，也未必是最完美的，我们想尝试，从理论上如何在这个框架基础上能够作出一些演进和创新。

另一方面，从现实出发，在此之前所有的预训练框架或者算法，都是海外研发的。如果我们还是沿着它们的脚步前进，未来可能有可能会形成技术路径依赖。而对核心技术和底层理论的自研和掌控，这是非常必要的。所以，我们也决定要自己去做这件事情。

2020年发布百亿参数大模型后，公司决定，投入千亿参数大模型研发中去。拿出大成本投入进去做这件事，事实上，还是需要一定的勇气的。

和OpenAI相比，这类海外企业有很强的资本背景加持，可以放开了去做，不惜烧掉无数的资本。但在那时，我们公司还刚成立，虽然也拿了一些钱，但是跟要做的这件事所需的资金来比，还是不太高的。从理论研究上来说我们比较擅长，但真的投入进去后，发现还是很难的。但GPT-3还是给了我们信心。技术积累、团队的共同努力，再加上一点运气，取得的效果比我们预期的还要好一些。

千亿大模型的发布，对于公司来讲是一个重要的转折点。我们可以进入一个比较快速的发展节奏了。

不得不说，其实后发还是有一定优势的，我们可以站在GPT的肩膀上前进，把GPT和其他模型架构的优点融合起来。去年11月，斯坦福大模型中心对于全球30多个大模型的横向评测结果显示：GLM-130B在准确性和公平性指标上与GPT-3 175B接近或持平，鲁棒性、校准误差和无偏性优于GPT-3 175B。

有一些企业尝试沿着GPT-3的路径去复现，其实反而没有做到这样一个程度。这也反证了，并不是简单地去复刻OpenAI的方法，你就能达到它的水平。

市界：GPT-4在今年3月发布后，引发了这一波大模型浪潮。作为早期就all in进去的公司，智谱是怎么看待这件事的？这给行业带来的最大变化又是什么？

张鹏：在去年年底的时候，我们还认为说，我们与GPT之间的距离已经在逐渐缩短。但GPT-4的发布让我们认识到，其实距离还是很大的，人家也在以更快的速度往前奔跑。

但至少，这再次证明了，我们选择的这条路是可行的，而且确实是存在很大发展可能的。

市界：在今年上半年，大模型批量涌现的时候，百度董事长兼首席执行官李彦宏就多次强调，不需要“重复造轮子”了。那么，现下中国还会再出现一个类似于OpenAI这样的公司吗？

张鹏：在国内完全复刻一个“中国版OpenAI”，这个是不现实的。

我们对标它，其实更多地也是从技术上，从目标和方向上去对标的。它是美国公司，用美国的方式在中国市场做公司，可能是活不好、行不通的。大模型创业公司还是要因地制宜，在商业化、市场化等方面，制定自己的具体策略。

没有基座，行业大模型是“空中楼阁”

市界：那么在商业化落地方面，智谱是如何做的呢？

张鹏：OpenAI的商业化路径其实很简单。除了收取ChatGPT的用户订阅费用外，它主要是对API调用收费，这也和它所处的市场环境有关。

我们的创始团队是从学校里出来，但在实验室里已经和很多企业、机构进行合作，在做To B方面的经验还是比较丰富的，对于这个市场也比较了解。我们在商业化路径上，会付出更多的精力，去设计一些符合客户需求的不同方案。

智谱AI为企业提供的服务模式更多。除了API调用外，还提供大模型服务私有化解决方案，包括云端私有化和本地私有化，用以适应当下市场和客户的需求。这应该是我们在国内独有的模式，相应的实际落地案例也已经有了不少。

市界：在大模型的商业化路径中，产业化趋势已经非常明显了。面向B端垂直行业的大模型，在短时间内纷纷涌现。对于做通用大模型和垂直行业大模型，智谱又是怎么思考的？

张鹏：智谱还是主要会加码研发基座大模型。对于行业模型这件事，我们确实也做过一些思考。

基座大模型和行业大模型，它们是并行关系、是竞争关系吗？但实际上，我们认为，行业模型或者叫专业模型也好，应该都是建立在通用模型之上的。打个比方说，任何一个行业的专家，首先是不是也要具备非常强的基础知识？同样地，做行业模型，你的基座从哪里来？还是一样要用别人的基座。从整个市场的角度来说，没有基座大模型的技术发展，是不可能“空中楼阁”式产生一大批行业模型的。

通用模型和行业模型，不是并行竞争的关系，而应该是合作关系。后者以前者为底座，是站在它们的肩膀上往上的。

行业大模型为什么存在？是因为现在市面上有这个需求。那么，企业的需求点到底是什么呢？我觉得，是在当下这个时间段上，大模型如何能够低成本、快速地去满足某些特定场景的需求。而正是因为我们的基础技术没有做到GPT的水平，才诞生了行业模型存在的空间。

但问题在于，如果行业模型不能基于最强的通用模型，一起去共同演进，那么它的市场空间也会越来越小，直到消失。

市界：大厂们也在积极推动大模型在产业中的落地应用，或者是利用本身的产业资源优势，做平台+行业解决方案+AI应用，获取企业客户。作为创业公司，在市场竞争中优势何在呢？

张鹏：和大厂比起来，我们是“船小好调头”了。我们和国内的大厂，基本上是竞合关系，有竞争，也有合作。

大厂的优势在于资源丰富，它们的摊子也铺得比较开。我们就是聚焦在做我们最擅长的事情：技术。在商业化落地方面，我们基于自有技术，会有更多的想法和灵活地处理去设计，帮助客户去真正创造价值。

现在很多人在强调行业利好时，都没有强调技术。我觉得，这是不准确的。人工智能发展的关键是什么？是认知，是对这个事情的宏观认知，对大目标、方向路径的认知，还有最关键的对技术的认知。

我们坚持做这件事，用很简单的一个问题就可以解释：一个供应商，它从头到尾所有的技术都是自研的，你会不会优先选择它？除非客户要求的只有低价，否则，只要企业有对未来的规划和预期，它自然就会作出选择。

现在我们和GPT-4还有距离，GPT-4和真正的AGI也更加遥远，大家的路还有很长。

市界：智谱AI的GLM-130B也选择了开源，前不久阿里的通义千问14B模型也宣布开源，可以免费商用。大模型开源开放是否是个大趋势？

张鹏：我们做开源这件事情，其实就是想保持AI生态的丰富程度。新的东西出来，不一定都最终会转换成有实际价值和前景的技术，但它代表着活力，它是一种概率。我们在做基座模型的时候，也没想说未来的基座模型只有一个。

市界：在大模型对公众开放后，智谱也推出了面向C端的大模型产品矩阵，包括对话、写作、绘画、编码等应用。那么，智谱对2B和2C业务之间的关系以及侧重点是怎么看的？AI应用层接下来会迎来爆发吗？

张鹏：从ChatGPT身上，我们就看到，To C应用是非常快速地积累用户、形成数据飞轮闭环非常好的一个路径。它的意义不在于可以赚多少钱，就算OpenAI好像也没在这件事情上赚到多少钱。

当然，从公司商业化角度来讲，它还有很多作用，比如说帮助你去拓展这个市场对公司和品牌的认知度等。你提到的很多产品，都是探索性质的，慢慢地，我们的规划里面会把这些东西探索出来。

我们也期待AI应用有一个大的爆发。或者不叫AI原生应用，而是叫大模型原生应用，因为AI还太宽泛，包含的东西还是比较多。在现在的时代，围绕大模型或者生成式AI，大家期待的是用大模型重塑很多东西，包括应用生态。

市界：“百模大战”持续了大半年，接下来，会不会出现行业整合的状态？

张鹏：整个行业的生态圈是会有一些变化发生的。之前的混乱状态肯定会逐渐结束，就像一池浑水，总会沉淀下来。慢慢地，大家会落到自己合适的、最擅长的位置上。那些长时间找不到自己定位和生存空间的，可能就会被淘汰，也许也会出现整合。

市界：智谱AI接下来的发展规划是什么？

张鹏：我们的定位仍然是做通用基座大模型。现在做C端也好，做垂直应用也好，目的都是为了“跑通”，利用我们的技术积累、知识，我们know-how的经验，去把这个事情跑通。之后，我们会把这些内容用开源、用培训和合作伙伴赋能等方式，把它释放出去。我们希望的是，整个市场蛋糕被做大。

可能我们还没有那个能力，能判断出整个大市场的趋势。但是我们的初衷就是想去努力做这件事情。

市界：智谱怎么解决高算力成本投入和人才缺口问题？

张鹏：算力确实是个大事。我们也启动了GLM国产芯片适配的工作。

实际上，我们从较早的时候就开始做这件事情了，和国产芯片厂商的合作也一直在推进。这其实是没有直接收益的，做这个要付出额外的成本，但是我们仍然在尽最大努力。国产芯片厂商们也投入了很大热情，我们能给它们带来机会，这些合作也是互利的。

作者 | 杨洁

编辑 | 孙春芳

运营 | 刘珊

中国需要“下一个OpenAI”吗？

中国需要“下一个OpenAI”吗？

推荐体验

相关资讯

中国需要“下一个OpenAI”吗？

OpenAI会是下一个Roblox吗？

OpenAI真的会成为下一个科技巨头吗？

ChatGPT 入网！会成为下一个MOSS吗？

AIGC是下一个PD-1吗？

近期资讯

RecycleView 局部刷新抽风闪烁

自学记录鸿蒙 API 13：实现人脸检测 Core Vision Face Detector

玩转 Vue 哲学：从 2 到 3，快乐的进化！

微信流量主挑战：用户数30！新增文档转化功能，解决docker运行jar包报错SimSun找不到的问题（新纪元5）

解决fragment异常Can not perform this action after onSaveInstanceState

React设计模式：构建可扩展应用的最佳实践

记录一次flutter项目更新到3.27

自学记录鸿蒙API 13：实现智能文本识别Core Vision Text Recognition

文件批量重命名工具

博客记录-day077-LockSupport+MySQL 有哪些锁

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响