当前位置:首页|资讯|OpenAI|百度|华为|腾讯|商汤

对话 | 出门问问李志飞:希望劝大家不要冲动做大模型,复制OpenAI没有意义

作者:搜狐科技发布时间:2023-04-21

原标题:对话 | 出门问问李志飞:希望劝大家不要冲动做大模型,复制OpenAI没有意义

出品|搜狐科技

作者|潘琭玙

4月20日,出门问问带着“序列猴子”大模型加入激战正酣的战场,CEO李志飞也表达了做大模型的决心,“可能是我最后一次All in去干一件事情”。

自百度“文心一言”拉开序幕后,4月份以来,阿里、华为、腾讯、商汤纷纷进场,短时间内超30个大模型呈百花齐放态势。

但李志飞却成为站在风口之上的“劝退派”,他在与媒体对话中解释了自己希望“劝一些人别做大模型”的初衷,是希望大家不要那么冲动。他认为,“入局第一天就想清楚,如果你是做大模型本身,做完后的下一步是什么。”但他也明确,出门问问All in大模型是他冷静思考后的决定。

他的朋友圈简介写着“Build AGI and Make AGI Accessible”,在对话中,他数次提及自己大量的时间在于理解这个模型本身,并把它变成可用的产品。

对他而言,近期对大模型的认知变化在于沉淀了长期主义的心态。此前他认为大模型壁垒高,但眼下门槛被踏破,玩家涌入竞争激烈,他希望基于出门问问的底子去做大模型,真正落地到应用场景。

他透露,在2月份的饭局上王慧文对大模型十分上头,并将其评价为“伟大的事情”。但李志飞则更多考虑效率与可用性,如何在同质化竞争中走出差异性。他表示,“我的价值就是我能用1/10的钱,干出比别人10倍好的事情。”

他也直面差距。在发布会的演讲中,他直言若GPT-4目前评分是100分的话,“序列猴子”目前只有50分,但他对50分很满意,他认为做大模型要循序渐进,“不要一上来就搞应试教育。”

而对于大模型领域的中美差距,他认为国内目前落后GPT-4约16个月。他的依据是,Google于 2022年1月发布的指令学习大模型Google FLAN约为目前大部分国内企业所处的模型阶段。此前李彦宏表示文心一言与GPT-4的差距为2个月,而周鸿祎则认为,中美的AI技术差距是24个月。

前些时日,OpenAI CEO山姆·奥特曼声称我们已处在大模型时代的尾声,李志飞对此持完全相反的观点,他认为大模型只是刚开始,模型的规模也会有很大的变化。同时,他也不认为应该做“中国的OpenAI”,他认为复制没有意义,“我更在乎能不能发挥我的才智,跟别人做的不一样。”

他对出门问问做大模型有商业化的实际考量,但他也是“AGI”的技术信徒。他将大模型比作人类发明的“上帝”,“我们对它很不了解,但我们可以对它进行分析研究,通过它对人类的大脑本身会有更多新的认知。”他直言,近期觉得最有意思的事情就是每天体验与分析自己大模型,去发现与理解。

以下为对话精编:

媒体:之前跟王慧文一起吃饭聊了什么?

李志飞:那天晚上老王也是比较上头的,但他自己对AI肯定是不了解的。所以我们当时聊了很多,比如说大模型是怎么回事,在中国会怎么做、竞争会怎么样。我说到竞争的时候,他说,“李志飞,这么伟大的事情,你还关心竞争。”他是非常上头,我有点上头,但肯定没有他那么上头。我们也聊过怎么互相合作,但我还是要在出门问问做大模型,而他是要独立做大模型,所以我们没办法有比较紧密的合作。

媒体:关于大模型近两个月有没有什么认知上的变化?

李志飞:从技术层面,我觉得大模型就是人类发明的一个上帝,我们对它很不了解,但我们可以对“上帝”去做很多分析研究。其实我大量时间也都是在understand,我想去理解这个模型本身,把它变成可用的产品,我觉得这个事情需要花时间去做的。

从商业层面,我以前说All in做大模型,但现在我不单独搞公司,而是利用我们已有的去做大模型。当时的判断觉得大模型壁垒很高,玩家少、投入大,但是现在到处都是大模型,竞争也很激烈。所以我调整了方式,我就是要长期主义,如果很急躁就会很痛苦。

媒体:近期大家一直讨论中美的差距,有的人说几个月、有的人说几年,这个话题您怎么看?

李志飞:我认为是16个月。在2020年6月份GPT3发布,到了2022年3月份GPT3.5发布,这中间其实发生了一件事,2022年1月谷歌发布指令学习大模型FLAN,中国企业目前发布的一批大模型与FLAN水平相近,如此推算,中美大模型的差距为16个月。

媒体:您感觉国内大模型会陷入同质化竞争吗?

李志飞:短期内我觉得同质化是必然的,因为它太容易达成共识了。很多人进来做大模型,先要求一个确定性,做完全不一样的东西不确定性太高。刚开始肯定是比较同质化的,但到后面,无论是巨头,还是新加入的创业公司,都得找到自己独特的定位。

媒体:上周OpenAI CEO奥特曼发表了一个观点,说巨型模型的时代结束了,OpenAI也估计扩大模型规模会出现收益递减,您认为大模型这条路还能走下去吗?大小模型协同应用会是更好的方法吗?

李志飞:我觉得这些观点大家听听就好了,不要觉得奥特曼说的就一定对。在我看来大模型只是刚刚开始,肯定没有接近所谓的“尾声”,模型的规模也肯定会有很大的变化。

大小模型协同是有可能的,因为用大模型要考虑价格高、回应速度各方面。每一个问题进来,可能会有某种办法在之间达成一些协作。像我们并不是所有的答案都是从大模型出来的,有一些的答案就是我们以前传统的系统出来的答案,比如天气、附近的川菜馆等

媒体:眼下大量入局者涌入大模型赛道,也纷纷在做自己的大模型。但是您的观点其实是站在风口上反而变得冷静了,您之前提到说“希望劝一些人不要去做大模型”,为什么这么说?

李志飞:我是想劝大家不要那么冲动,入局第一天就想清楚,如果你是做大模型本身,做完大模型以后,下一步是什么。比如你的商业定位、独特的竞争优势、在哪一些场景去落地。我感觉过去这一个月太疯狂了,无论是巨头每一个人都很急。所以希望大家可以更加理性,但是对出门问问而言,我们All in做这个事情是确定的。

媒体:之前您说有“中国的open AI”,然后但是前两天您说中国有50个大模型,但是不会出现OpenAI,原因是什么?

李志飞:其实我从来没说过会有中国的OpenAI。第一复制OpenAI没有意义,第二也不一定能够跟得上。就算是今天要我重新来一遍,我能够做到今天出门问问的样子吗,我觉得不一定。所以也不太可能去重复做出OpenAI,他们找了很不一样的一条路,而且国内外的创投环境不一样,所以也要因地制宜。中国的OpenAI也不会是出门问问的目标,我的初心是去造大模型、理解大模型、把大模型用起来。我觉得我的价值就是我能用1/10的钱,干出比别人10倍好的事情,我更在乎能不能发挥我的才智,跟别人做的不一样。

媒体:您觉得未来有机会的话,是创业公司能更好地走出来还是头部企业?

李志飞:之前有人说过,头部企业没有办法实现自我的革命。但我还是觉得以今天中国巨头的努力程度,他们已有的业务很难被颠覆。他们确实有可能把它已有的业务去升级。

然后对创业者而言,找到to B我觉得还是会有机会,最后还是取得供需的平衡。可能会有新的应用形态或者智能硬件载体,这个可能是创业公司的机会。

媒体:出门问问如何去思考成本问题?有没有思考,引进什么样的投资者或者选择怎么样的投资者?

李志飞:我们其实不融资。2012年至今,出门问问到了这个阶段,我不需要进入融资再烧钱,之后开始亏损再进入裁员优化的循环。我们公司的商业化做得是挺不错的,目前要烧钱的也就是大模型部分,我们过去还是融了不少钱,所以我们账上还有不少钱。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1