经济观察网 记者 钱玉娟 因为宣布“要在大模型领域创业,做中国的OpenAI”,出门问问创始人兼CEO李志飞在近几天也成为科技圈关注的对象之一。
“看到了一个通用认知模型的希望。”2月19日,李志飞道出了自己“对大模型如此狂热”的原因所在,“语言、知识、逻辑、规划等问题,都看到了迎刃而解的可能。”
三年前早有筹谋
在中国涌动的人工智能产业浪潮里,出门问问虽是弄潮儿之一,却在近几年里鲜少被提及。加之在ChatGPT火爆的大背景下,李志飞创业,不免有观点认为他在跟风。
曾是Google总部科学家队列一员的李志飞,在人工智能语音语义技术领域拥有近二十年的科研及产业经验。2012年,他回国创立了人工智能公司出门问问,该公司主要通过智能手表、车载智能后视镜等软硬结合的产品,落地在可穿戴、车载以及家居等生活场景中,以打造下一代的人机交互方式。
“出门问问和我过去几年,确实很沉默。”李志飞坦言,“本人厌倦了创投圈总体成王败寇的氛围”,于是选择“躺平”以真正花时间在内部解决一些问题。在他看来,出门问问面临着过去探索带来的包袱问题,以及AI行业的长期商业模式问题。
李志飞谈及出门问问的传统智能硬件和TO B业务的状况,“在AI公司里算是不错的”,用他自己的话说:合理的毛利率,不追求高速增长,更多是优化各项成本费用以及最终的利润率。
“绝望激发了更强的求生欲。”在2022年最后一天, 李志飞如此写到,他觉得过去一年的疫情状况“令人窒息”,当然,令他感到开心的事是,读了很多关于AI的最新论文,花了很多时间做AIGC(AI Generated Content,是指利用人工智能技术来生成内容)产品。
谈到当前热门的AIGC技术,李志飞表示,出门问问早自2019年底便开始研发,如今成熟的产品有“魔音工坊”,趋近成熟的产品有数字形象平台“奇妙元”,以及AI写作和图片生成产品“魔撰”、“言之画”。
李志飞透露,魔音工坊有接近200万注册创作者,商业化初具规模。他认为,无论用户量还是营收规模指标,出门问问在中国AIGC领域都属于领头羊。
曾与李志飞并肩作战多年的叶顺平,曾在出门问问负责技术侧。“志飞对大模型情有独钟。”叶顺平透露,早些时候,李志飞就在出门问问内部提出,“想统一各个任务的模型结构”,彼时讨论最多的是ChatGPT用的底层架构Transformer。
“志飞还在很长一段时间里,拉公司的核心技术人定期讨论大模型相关技术。”叶顺平的话也得到了一位现役出门问问员工的佐证。后者告诉记者,三年前GPT-3刚发布后,李志飞总会和一群核心工程师在办公室探讨技术,“每周一次,讨论的都是大语言模型相关算法。”
创新中国自主大模型
当国内互联网科技巨头纷纷展开类ChatGPT相关AI技术产品的布局,上述出门问问人士告诉记者,这也是他们“一直想做,能做”的事,且早已聚焦其中,“做了不少前沿探索的事情,在国内公司中也走在了前面”。
三年前,看到OpenAI推出的GPT-3模型的惊艳表现后,李志飞便将AI大模型视为了“新时代的蒸汽机”,他还是大模型“暴力美学”这一概念的提出者。
在李志飞看来,GPT模型经历三代演变,训练数据、模型参数、任务数量都有迭进式增长,GPT-3的参数更是扩展至1750亿。尤其站在工业界视角来看,他认为,GPT-3的“暴力美学”让人看到了通往“更加通用的人工智能”的希望。
当然,李志飞并不觉得只有大公司才具备挖掘AI大模型的潜力,他看到很多创业团队开始利用GPT-3模型展开研究和创新拓展,出门问问就是其中之一。
“目前我们也在对新的技术加以梳理。”上述出门问问人士说。实际上,出门问问能较早在AIGC技术方面突围,叶顺平认为要归功于李志飞,“(他的)技术判断力和对趋势的判断,确实让人佩服。”
2022年10月,一位投资人就曾对李志飞说,“你的时代到了。”彼时的李志飞没想到,等他今年春节过后,再次飞到硅谷“朝圣”时,像ChatGPT这样的AI大模型兴起,仿佛2010年移动互联网刚起步之时,微软、Google这样的大公司都在“醒过来”,“争取拿到下一个时代的船票”。
李志飞深切地感受到,AI大模型为科技圈打开了一扇“新的天窗”,创新机会无处不在。得知他再创业的消息后,一位科技公司CEO评价到,“志飞的本垒打,万众瞩目。”
李志飞十分笃定,“这场世界的AI大变局,我们也不能缺席。”对于做大模型,他觉得像哥伦布发现新大陆,过程中会有无穷的风浪。
在李志飞看来,中国在海量数据方面具有优势,但自主研发通用认知大模型,还存在人才少这一劣势,“缺少训练超强大模型的经验。”身处当前技术变革的时间窗口,他分析认为,假若有公司在人才、数据及资金等方面建立起了壁垒,“更小的团队就没有机会了”。
李志飞深知,当下全球科技企业都在争分夺秒,以拿到新一轮产业竞赛的参赛资格,“自主通用认知大模型,中国能做,也必须做。”但他建议,在AI产业深耕的国内科技企业,应该先把骨架造得足够稳定,尤其是做垂直于某一场景的大模型或应用,“慢慢来。”