当前位置:首页|资讯|OpenAI

中国需要“下一个OpenAI”吗?

作者:AI财经社发布时间:2023-11-06

原标题:中国需要“下一个OpenAI”吗?

国内估值最快速超过百亿的大模型创业公司诞生了。10月20日,清华团队出身的大模型公司智谱AI宣布,今年内已融资25亿元。有媒体称,这家成立于2019年的公司最新估值已经超100亿元,最高或达到150亿元。

在公开的融资信息中,智谱AI的投资方颇为引人注目,包括了美团、阿里、蚂蚁、腾讯、小米、金山、顺为资本、Boss直聘、好未来、红杉资本和高瓴等。尤其是在大模型赛道上一直各自为战的腾讯和阿里,这次也联手投了同一家项目。

国内大模型创业,清华系撑起了半壁江山。智谱AI和清华大学的关系更为紧密。智谱AI成立于2019年6月,由清华大学计算机系知识工程实验室(KEG)的技术成果转化而来。公司核心团队中,CEO张鹏出身于清华计算机系,和公司总裁王绍兰均为为清华创新领军工程博士。现在智谱AI的不少研发人员,也曾参与过清华大学与智源研究院的合作的“中国首个+全球最大”悟道大模型项目。

大模型创业公司中,是否还能够诞生一个“中国版OpenAI”?面对互联网大厂们的资源和技术优势,创业公司们又要如何突出重围?围绕诸多问题,市界近期和智谱AI CEO张鹏进行了深度对话。

复刻“中国版OpenAI”并不现实

市界:智谱AI在2019年正式成立,第二年,OpenAI发布了GPT-3。在当时,你们就认识到大模型的研发会是未来的方向吗?在行业早期就all in到基座大模型的研发中去,并在2022年推出了GLM-130B,这中间智谱经过了什么思考?

张鹏:我们的公司是在2019年成立的。GPT-3发布时,公司刚刚成立一周年。其实之前我们就一直在关注这个事情,当时正值公司一周年的庆典,我们邀请了中国科学院张钹院士来参加活动,我们也讨论了要聊些什么,但大家的关注点还是放在了GPT-3上。

在早期,我们的团队就发布了名为AMiner的平台,用以做科研情报分析和数据挖掘,因此我们对于这件事的敏感度是非常高的。在2019年开始,公司就在做一些相关的算法研究,也是差不多沿着这个方向在做。GPT-3的发布,其实是给我们带来了一个信号:有人跑在前面了,这意味着,大模型的临界点终于到了。

市界:大语言模型预训练框架存在不同的技术路径,OpenAI选择的是GPT,谷歌选择的是BERT,作为一家创业公司,智谱为什么不用现成的,而是花大力气自研GLM架构?

张鹏:一方面是出于技术探索和理论研究层面出发,我们是一直在关注这个技术,自己也有一些积累。GPT这个框架,也未必是最完美的,我们想尝试,从理论上如何在这个框架基础上能够作出一些演进和创新。

另一方面,从现实出发,在此之前所有的预训练框架或者算法,都是海外研发的。如果我们还是沿着它们的脚步前进,未来可能有可能会形成技术路径依赖。而对核心技术和底层理论的自研和掌控,这是非常必要的。所以,我们也决定要自己去做这件事情。

2020年发布百亿参数大模型后,公司决定,投入千亿参数大模型研发中去。拿出大成本投入进去做这件事,事实上,还是需要一定的勇气的。

和OpenAI相比,这类海外企业有很强的资本背景加持,可以放开了去做,不惜烧掉无数的资本。但在那时,我们公司还刚成立,虽然也拿了一些钱,但是跟要做的这件事所需的资金来比,还是不太高的。从理论研究上来说我们比较擅长,但真的投入进去后,发现还是很难的。但GPT-3还是给了我们信心。技术积累、团队的共同努力,再加上一点运气,取得的效果比我们预期的还要好一些。

千亿大模型的发布,对于公司来讲是一个重要的转折点。我们可以进入一个比较快速的发展节奏了。

不得不说,其实后发还是有一定优势的,我们可以站在GPT的肩膀上前进,把GPT和其他模型架构的优点融合起来。去年11月,斯坦福大模型中心对于全球30多个大模型的横向评测结果显示:GLM-130B在准确性和公平性指标上与GPT-3 175B接近或持平,鲁棒性、校准误差和无偏性优于GPT-3 175B。

有一些企业尝试沿着GPT-3的路径去复现,其实反而没有做到这样一个程度。这也反证了,并不是简单地去复刻OpenAI的方法,你就能达到它的水平。

市界:GPT-4在今年3月发布后,引发了这一波大模型浪潮。作为早期就all in进去的公司,智谱是怎么看待这件事的?这给行业带来的最大变化又是什么?

张鹏:在去年年底的时候,我们还认为说,我们与GPT之间的距离已经在逐渐缩短。但GPT-4的发布让我们认识到,其实距离还是很大的,人家也在以更快的速度往前奔跑。

但至少,这再次证明了,我们选择的这条路是可行的,而且确实是存在很大发展可能的。

市界:在今年上半年,大模型批量涌现的时候,百度董事长兼首席执行官李彦宏就多次强调,不需要“重复造轮子”了。那么,现下中国还会再出现一个类似于OpenAI这样的公司吗?

张鹏:在国内完全复刻一个“中国版OpenAI”,这个是不现实的。

我们对标它,其实更多地也是从技术上,从目标和方向上去对标的。它是美国公司,用美国的方式在中国市场做公司,可能是活不好、行不通的。大模型创业公司还是要因地制宜,在商业化、市场化等方面,制定自己的具体策略。

没有基座,行业大模型是“空中楼阁”

市界:那么在商业化落地方面,智谱是如何做的呢?

张鹏:OpenAI的商业化路径其实很简单。除了收取ChatGPT的用户订阅费用外,它主要是对API调用收费,这也和它所处的市场环境有关。

我们的创始团队是从学校里出来,但在实验室里已经和很多企业、机构进行合作,在做To B方面的经验还是比较丰富的,对于这个市场也比较了解。我们在商业化路径上,会付出更多的精力,去设计一些符合客户需求的不同方案。

智谱AI为企业提供的服务模式更多。除了API调用外,还提供大模型服务私有化解决方案,包括云端私有化和本地私有化,用以适应当下市场和客户的需求。这应该是我们在国内独有的模式,相应的实际落地案例也已经有了不少。

市界:在大模型的商业化路径中,产业化趋势已经非常明显了。面向B端垂直行业的大模型,在短时间内纷纷涌现。对于做通用大模型和垂直行业大模型,智谱又是怎么思考的?

张鹏:智谱还是主要会加码研发基座大模型。对于行业模型这件事,我们确实也做过一些思考。

基座大模型和行业大模型,它们是并行关系、是竞争关系吗?但实际上,我们认为,行业模型或者叫专业模型也好,应该都是建立在通用模型之上的。打个比方说,任何一个行业的专家,首先是不是也要具备非常强的基础知识?同样地,做行业模型,你的基座从哪里来?还是一样要用别人的基座。从整个市场的角度来说,没有基座大模型的技术发展,是不可能“空中楼阁”式产生一大批行业模型的。

通用模型和行业模型,不是并行竞争的关系,而应该是合作关系。后者以前者为底座,是站在它们的肩膀上往上的。

行业大模型为什么存在?是因为现在市面上有这个需求。那么,企业的需求点到底是什么呢?我觉得,是在当下这个时间段上,大模型如何能够低成本、快速地去满足某些特定场景的需求。而正是因为我们的基础技术没有做到GPT的水平,才诞生了行业模型存在的空间。

但问题在于,如果行业模型不能基于最强的通用模型,一起去共同演进,那么它的市场空间也会越来越小,直到消失。

市界:大厂们也在积极推动大模型在产业中的落地应用,或者是利用本身的产业资源优势,做平台+行业解决方案+AI应用,获取企业客户。作为创业公司,在市场竞争中优势何在呢?

张鹏:和大厂比起来,我们是“船小好调头”了。我们和国内的大厂,基本上是竞合关系,有竞争,也有合作。

大厂的优势在于资源丰富,它们的摊子也铺得比较开。我们就是聚焦在做我们最擅长的事情:技术。在商业化落地方面,我们基于自有技术,会有更多的想法和灵活地处理去设计,帮助客户去真正创造价值。

现在很多人在强调行业利好时,都没有强调技术。我觉得,这是不准确的。人工智能发展的关键是什么?是认知,是对这个事情的宏观认知,对大目标、方向路径的认知,还有最关键的对技术的认知。

我们坚持做这件事,用很简单的一个问题就可以解释:一个供应商,它从头到尾所有的技术都是自研的,你会不会优先选择它?除非客户要求的只有低价,否则,只要企业有对未来的规划和预期,它自然就会作出选择。

现在我们和GPT-4还有距离,GPT-4和真正的AGI也更加遥远,大家的路还有很长。

市界:智谱AI的GLM-130B也选择了开源,前不久阿里的通义千问14B模型也宣布开源,可以免费商用。大模型开源开放是否是个大趋势?

张鹏:我们做开源这件事情,其实就是想保持AI生态的丰富程度。新的东西出来,不一定都最终会转换成有实际价值和前景的技术,但它代表着活力,它是一种概率。我们在做基座模型的时候,也没想说未来的基座模型只有一个。

市界:在大模型对公众开放后,智谱也推出了面向C端的大模型产品矩阵,包括对话、写作、绘画、编码等应用。那么,智谱对2B和2C业务之间的关系以及侧重点是怎么看的?AI应用层接下来会迎来爆发吗?

张鹏:从ChatGPT身上,我们就看到,To C应用是非常快速地积累用户、形成数据飞轮闭环非常好的一个路径。它的意义不在于可以赚多少钱,就算OpenAI好像也没在这件事情上赚到多少钱。

当然,从公司商业化角度来讲,它还有很多作用,比如说帮助你去拓展这个市场对公司和品牌的认知度等。你提到的很多产品,都是探索性质的,慢慢地,我们的规划里面会把这些东西探索出来。

我们也期待AI应用有一个大的爆发。或者不叫AI原生应用,而是叫大模型原生应用,因为AI还太宽泛,包含的东西还是比较多。在现在的时代,围绕大模型或者生成式AI,大家期待的是用大模型重塑很多东西,包括应用生态。

市界:“百模大战”持续了大半年,接下来,会不会出现行业整合的状态?

张鹏:整个行业的生态圈是会有一些变化发生的。之前的混乱状态肯定会逐渐结束,就像一池浑水,总会沉淀下来。慢慢地,大家会落到自己合适的、最擅长的位置上。那些长时间找不到自己定位和生存空间的,可能就会被淘汰,也许也会出现整合。

市界:智谱AI接下来的发展规划是什么?

张鹏:我们的定位仍然是做通用基座大模型。现在做C端也好,做垂直应用也好,目的都是为了“跑通”,利用我们的技术积累、知识,我们know-how的经验,去把这个事情跑通。之后,我们会把这些内容用开源、用培训和合作伙伴赋能等方式,把它释放出去。我们希望的是,整个市场蛋糕被做大。

可能我们还没有那个能力,能判断出整个大市场的趋势。但是我们的初衷就是想去努力做这件事情。

市界:智谱怎么解决高算力成本投入和人才缺口问题?

张鹏:算力确实是个大事。我们也启动了GLM国产芯片适配的工作。

实际上,我们从较早的时候就开始做这件事情了,和国产芯片厂商的合作也一直在推进。这其实是没有直接收益的,做这个要付出额外的成本,但是我们仍然在尽最大努力。国产芯片厂商们也投入了很大热情,我们能给它们带来机会,这些合作也是互利的。

作者 | 杨 洁

编辑 | 孙春芳

运营 | 刘 珊


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1