三年没开发布会了,出门问问CEO李志飞激动得连发布会都搞错了,恨不得“安利”每款新品的每个功能。4月20日,出门问问启动大模型“序列猴子”内测,同时发布多款面向创作者的AIGC(人工智能生成内容)产品,琢磨大模型很多年的李志飞终于在自己的主场开讲。
博士期间对AI认知的思考、微软有关AGI(通用人工智能)的最新论文,让李志飞成了“AGI信徒”,近期大模型明星赛又让他成了“大模型劝退派”,看似矛盾的态度让他增加了不少曝光度,出门问问11年来蹚过的坑能否成为他的光环?
一场大模型讲座
“AGI是一个单一AI系统,能够掌握人类的语言、知识、逻辑、数学、推理以及对解决复杂问题的规划能力。”
“大模型不只是‘大’,而是要有一个深度的建模,是互联网文本序列+N-gram Counts(一种基于统计语言模型的算法)+Smoothing(平滑),但今天的大模型只是对互联网文本的表层建模”……
4月20日,科班出身的李志飞一上场就甩出一系列专门术语,连序列猴子这个大模型名称都是基于一个概率论和组合数学的定理,有些晦涩,但和他的风格很搭。
2023年春节的第二天,李志飞赶往美国“解密”ChatGPT。ChatGPT到底是怎么做出来的?为什么是OpenAI做出来的而不是别人?带着这两个疑问,他和很多人聊,包括OpenAI的工程师。如今,出门问问拿出了自己的大模型,他也找到了那两个答案,于是有了出门问问的发布会和开场那一堆烧脑的概念。
简单点说,“序列猴子”是一款具备多模态生成能力的大语言模型,能够同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。
4月20日的现场演示也聚焦在上述能力,展示的产品包括面向C端的升级版语音助手魔法小问、面向B端的企业专属大模型,以及面向创作者AI写作平台“奇妙文”、AI绘画平台“言之画”、AI配音平台“魔音工坊”、数字人视频与直播平台“奇妙元”。
当李志飞和团队演示规划、推理、逻辑能力时,会紧张也会求掌声,当魔音工坊“秀肌肉”时,发音人李满超还现场吐槽“翻车了”。有惊喜有遗憾,李志飞和其他现场演示的企业高管一样,都没藏着掖着,“表现正常吧”,会后他向北京商报记者表示。
“悲壮”的All in
假设GPT-4是满分100,再把测试问题扩大到500个,出门问问给目前的主流大模型打出了具体的分数,GPT-3.5是80分,序列猴子50分,另一个大模型33分。李志飞没有透露得33分的到底是哪个,但他对自己的50分很满意。
“做大模型要循序渐进,不要一上来就搞应试教育,33分的也不要焦虑,很快就会提升,早一个月晚一个月没什么事,要保持长期主义”,李志飞说,等到大模型顿悟,提分是很快的。两三周前,序列猴子顿悟时,他兴奋地连跟朋友约饭的兴趣都没了,当晚跟大模型聊到凌晨两点。
出门问问、长期主义,成立11年来,业内人士不常把两者联系在一起。
“这些年,出门问问像是被行业裹挟着前进,做语音助手、做智能音箱、车载,做SaaS(软件即服务),感觉焦点不明确”,比达咨询分析师李锦清向北京商报记者表示,不变的是一直在AI赛道里。
现阶段,李志飞有了非常坚定的信念,就是大模型,“可能这么说有点悲壮”,他笑了笑,“这可能是我最后一次All in 干的一件事。”
卷,太卷了
百度的文心一言、阿里的通义千问,以及其他大厂和创业公司的通用大模型、专属大模型都在秀功能,每家也都在说自家的进步惊人。
3月底,李志飞预测一两年后,中国至少50家以上公司都会拥有自己的大模型。4月,阿里、字节跳动、腾讯、360、昆仑万维、商汤科技、知乎……通过各种角度在大模型赛道刷存在感,一众明星创业者美团元老王慧文、搜狗创始人王小川等也盯着大模型跃跃欲试。
在中国聚焦落地的大模型,“将会有几十家而卷出天际,大概率跟上一代AI公司一样,商业化异常艰难”,李志飞判断,这是他劝退同行的原因之一,“大家不要那么冲动,你得第一天就想清楚大模型做完后下一步是什么,商业定位有什么不一样?在哪些场景落地,现在无论巨头还是创业者都很急,希望大家更加理性”,李志飞向记者解释。
钉钉总裁叶军也跟记者谈到了内卷,“现在刚开始,可能得卷两年,卷五年的话,就有点多了”。
竞争不可避免,不论国内还是国外AI圈。2月时,李志飞走进美国帕洛阿托university avenue的blue bottle咖啡厅,惊讶于听到的都是Chat、Chat、ChatGPT。回到国内发现,竞争激烈程度可能是美国的10倍。
北京商报记者 魏蔚