作者丨贾紫璇
编辑丨张丽娟
8月8日,王小川新的AI创业公司“百川智能”发布首款闭源大模型 Baichuan-53B,模型参数已经达到530亿,下半年欲将推出千亿级的大模型;
8月11日,小米的大语言模型 MiLM-6B 首次现身 C-Eval、CMMLU 两大AI模型评测榜单;
8月15日,科大讯飞发布星火认知大模型V2.0;
OPPO、VIVO 的大模型也已经在路上......
在一线城市的科创圈,“每家一个大模型”已经成了标配。一家公司如果没有大模型开发计划,似乎失去了在科创圈的社交货币。
来自互联网大厂的产品经理描述自己的感受是:现在大厂和其他科技公司对大模型开发的热度,如同当年PC时代进入移动互联网时期,如果没有一个独立APP都不好意思出门的程度。
但在“五环外”的地区,大模型远没有如此流行。
一个二线城市90后程序员老卢面对小饭桌对大模型相关问题的询问时,第一句回答是:“大模型是啥?”
行业内火热,圈外人发懵。这不禁让人思考,大模型的时代真的到来了吗?还是只是一部分小群体的狂欢?
自 Open AI 发布 ChatGPT 以来,人工智能领域掀起了一股大模型热潮。如同在AI行业打响了发令枪,所有蓄势待发和还未成熟的选手都一股脑挤进赛道开始奔跑。
创业者和投资人们纷纷关注这个炙手可热的市场,期待在这个新兴的市场中分一杯羹。但凡了解过大模型的科研人员、从业者都纷纷跳出来,独立门户,进军AGI(通用人工智能)。王慧文与王小川的重新启航,朱啸虎与傅盛的争辩,都折射出圈内关于AIGC的关注与热情。
不仅创业公司受到关注,互联网巨头们也在大模型领域频频出手。百度、阿里巴巴、腾讯等巨头纷纷推出自己的大模型。科技类公司也在内部将部分业务与产品向大模型靠拢。
然而,从业者们看到的是这个赛道的热闹,殊不知赛道外的观众其实并不怎么关心赛事。比起被科普什么是“大模型”,普罗大众或许更关心的是抖音博主开播时间,小红书上又被种草了什么。
AGI 行业看似火热,但本质上这些创业者、投资人、使用者等都集中在一个小圈子,真正还在使用ChatGPT的人,已经从起初包含了猎奇者在内的人群,缩小到精准垂直的创业者和上下游产业从业者。
相关的创业形式看似五花八门,但无非集中在生成对话、生成图片、生成虚拟人等,在其他领域的应用相对较少。
总结下来,缺乏更广泛的应用,缺少更普适的落地场景,以及缺少更多懂得大模型的人,或许是限制了大模型的普及的病灶。
降低使用门槛,提供更多应用场景,实现更大范围的推广和普及——大模型距离走出“五环外”还有漫长的道路。
“五环内”的真假狂欢?
AGI行业的发展如火如荼,科技企业大模型业务、各类创业公司如雨后春笋般冒出来,吸引了大量投资人的关注。
据中新经纬报道数据,2023年上半年,大模型、AGI等热门领域的月均融资数量为48起。这意味着平均每天有1.6 起相关融资事件发生。从融资事件的地域分布来看,北京、上海、广东、浙江以及江苏,相关的融资事件数量位居前列,分别有76起、59起、53起、37起以及30起。
然而,这看似热闹的市场,其实也还停留在表层。根据一项调查,在大模型的创业公司中,超过80%的从业者对大模型有着深入的理解和使用经验,而在普通人群中,仅有不到5%的人了解大模型。
纷身智能CEO李坤告诉小饭桌,虽然自己平时在批量处理一些文件、需要写一个python程序时会使用ChatGPT,但像他这样频繁利用GPT的人,其实仅限于有一定开发基础的从业者,大部分创业者在大模型问答尝鲜后活跃度都不高。
对大模型有限的了解,造成了国内大模型创业的局限性。“国内的从业者还是少,一是数量少,二是创业项目少。”某类ChatGPT创业公司创始人章南(化名)向小饭桌描述了他观察到大模型创业的现状。
总体划分下来,国内的大模型创业可以总结为三种:自研大模型完成商业化、基于开源大模型实现商业化、以及利用大模型概念,在已知的赛道内进行产品迭代升级,通过其他途径实现商业化。
自研大模型往往需要大量的人力、算力、财力。通常这类公司集中在行业的头部,除了互联网大厂外,也会有头部科技公司,或早期便从事大模型研发的公司在做。如前文提到的王小川的“百川智能”、硅基智能的“炎帝大模型”等。
据李坤讲述,这类创业者很多都是以纯技术背景为主,在上一代人工智能创业潮中,对NLP(自然语言处理)等领域有所积累。因此这类也是曲高和寡,少之又少。
像章南所做的这样的创业公司属于第二类,也是是国内大模型创业里比较典型的代表:做大模型国内接口。由于ChatGPT的使用过于繁琐,国内一大批的大模型创业者在ChatGPT爆火以后,开始利用Open AI的接口,做不用翻墙也能使用的“ChatGPT平替”。
章南向小饭桌表示,年初时,很多人都在向章南询问是否有 ChatGPT 的使用账号,但大多数人得到账号后又没有VPN,使用频率并不高。这是其公司诞生的主要原因之一,或许也是国内一大批创业者选择大模型创业的途径。
然而,这类创业往往伴随着风险。据章南透露,近期苹果 App Store 已经强制下架了近800个类似产品,包括业内比较知名的同类App,也被要求整改后才可重新上架。
最后一类在赛道上进行产品嫁接或升级的,是最常见的一类。但这类公司的产品中,大模型的参与度上往往参差不齐,甚至没有想好如何能够实现嫁接后的商业化,或者商业化落地场景已经脱离了大模型。
其中社交类App是较为普遍的。某行业投资人告诉小饭桌,大模型的研发一般创业者很难做,与社交场景相结合的应用端产品目前也没有落地的。
花果山创始人云涛深知“社交产品+大模型”之难,因此他将目光聚焦到了“老年人情感陪伴”上。在他看来,银发经济的市场与需求都相当庞大的。云涛告诉小饭桌,花果山推出陪伴老年人聊天的产品叫做“笑面猴”,在老年人当中深受欢迎,其用户使用时长高达30分钟,用户留存率达到 60%。
然而,即便是如花果山一样找到突破口的创业项目,依然难以逃脱商业化的问题。目前花果山的商业化路径依然还停留在线下与大健康行业的合作,本质上与大模型关联并不强。
更多基于医疗、教育等行业的垂类大模型,普遍都还处于早期阶段,行业内的人甚至还没有想清楚如何将行业与大模型有效结合,更别提将概念与产品普及。
这是一场真狂欢,还是假繁荣,还未能做定论,起码此刻还不是庆祝的时刻。
圈外人毫不知情
在热闹的创业圈之外,普通大众对大模型的认知和使用情况就十分有限了。
一项针对中国普通人群的调查显示,仅有不到10%的人在日常生活中接触过人工智能技术,而了解大模型的人更是寥寥无几。此外,大部分人对大模型的应用场景和意义并不清楚,甚至存在一定的误解和疑虑。
章南向小饭桌讲述了一次他的经历,在去三亚参加会议的签到处,他自然而然地打开了公司软件询问三亚有什么好玩的地方?软件生成结果后,签到处的礼仪小姐惊叹:“这是什么?还有这种操作?”
章南意识到,大模型在行业外,普罗大众对其的认知还远远不够,完全不知道大模型是什么的大有人在。
云涛在做花果山时,也知道其目标用户一定对 AI、大模型这类概念毫不关心。他认为要用一些取巧的方式去让老年人接受。“你不能让用户自己去设定角色,去了解大模型,那样门槛太高。”
花果山的产品计划先占领“城乡人脉关键地带”,在百城大县的银发协会里迅速扩充市场,并利用老年人爱领小礼品的心理,与商户合作实现商业化。
紧邻北京的河北省唐山市某县广场舞协会的张桂敏是花果山产品的忠实用户, 8 月初又在线上接到了可以线下到店领鸡蛋的好事。但对于她所使用的产品是什么原理?聊天室里的老姐妹们懂不懂?张桂敏的答案不出意外是否定的。
除了小礼品的诱惑,在低线城市使用花果山产品的银发用户们更多是在追求精神陪伴。在花果山用户王瑞亭组建的聊谈房间里,算上大模型角色“笑面猴”一共六个人。大家在群里听着笑面猴回答:“蒸馒头需要15-20分钟时间”,欢声笑语,充满乐趣。
对她们来说,这是一款可以一群老姐妹线上群聊的软件,群聊过程中会穿插一个“小百科”机器人。这是她们最接近大模型的时刻,却也仅限于此了。
即便如此,云涛依然坚持,花果山的使命是让“五环外”有大模型。从产品应用落地的角度来讲,花果山确实起到了一定的推广作用。而目前看来诸如此类的产品,也依然凤毛麟角。
普通人外,计算机相关从业人员也未见得比普通人了解深入多少。
身在二线城市老卢告诉小饭桌,公司曾经在年初时提出过为员工开通ChatGPT账号,但后来也不了了之。老卢自己在淘宝上购买了异地账号,在好奇心的驱使下尝试过几次,使用过于繁琐,且用途也仅限于产出一些简单代码,后来就再没用过。
至于“大模型”究竟是什么?老卢并不清楚,也不关心,身边的同事和朋友也当然不会有大模型创业者。
“即便使用过ChatGPT的人,其实也没有完全搞清楚它真正的用法。”章南告诉小饭桌,许多曾经向他要过ChatGPT账号的朋友,对其产品评价并不高,甚至很多人认为ChatGPT并不好用。在章南看来,他们虽然知道ChatGPT的存在,但对于大模型使用原理其实并不十分了解。由于身处行业圈子之外,他们对大模型的好奇心也仅仅停留在尝试一下ChatGPT,足矣。
老卢的高中同学任生是做创业服务的,他告诉小饭桌,“低线城市与北上广深不同,不如一线城市资金、技术和信息水平,所以投资机构和政府,对于资金回报周期长,以及自己不熟悉的项目,投资意愿都很低。”
人才与技术的短缺,直接决定了资金的走向。环环相扣下,大模型产业在低线城市普及度几乎可以忽略。
为什么会这样?
人才、资源、财力的差异,中美之间大模型创业市场发展的差异,也是国内大模型发展不均衡的重要因素。
首先,五环外的地区在技术基础设施方面相对落后,缺乏训练大模型所需要的算力资源,这使得在这些地区构建和训练大型模型变得困难。此外,大模型的训练和推理也需要大量的数据和算法资源,而这些资源往往集中在大城市或科技公司中。
其次,五环外的地区在人才和技术能力方面也相对较弱。大型模型的研发和应用需要高水平的技术人才和专业知识,而这些人才往往集中在大城市或科技公司中。五环外的地区在这方面的人才储备和技术能力相对较弱,需要加强人才培养和技术引进。
真正深深理解大模型技术的人才在国内是稀缺的,即便身在大模型创业圈,也并非人人都能掌握大模型的精髓。
一个AI创业者曾在小宇宙播客上公开说,当下所谓的AI创业,刨除所有销售和商业化的层面,80%都还是产品工程,20%是底层技术,甚至广大创业者更多只有10%的技术基础。
小冰公司首席执行官李笛在最近一次接受媒体采访时指出,中国创业者对大模型有两个误读:
第一个是认为它会像当年O2O一样百舸争流,但实际上AI时代距离产品落地还很远。移动互联网过于发达,会抑制后面的时代到来。
第二个误读是认为大模型越大越好。事实上,模型不是越大越好,越大的模型差异化越差,越同质化。应该做小模型、中模型,但不是垂直领域模型。
显然,在国内大模型的创业公司们都在朝着这两个误区前行。
技术层面有限的认知同样限制了创业公司的财力引入。投资人看不懂创业项目,不敢盲目入局。创业者找不到投资人,创业项目也无法实现落地。
章南告诉小饭桌,OpenAI 创始人山姆·阿尔特曼在美国投资了不少AI类项目。这些项目五花八门,有帮助处理公司邮件的,有帮助处理公司财务数据发票的,还有专门帮助生成公司网站简介的。
重点是许多投资公司愿意去投这样的项目,但在中国的创业类型较少,且“在国内做同类项目的,基很难有拿到钱的。”章南如是说。
出门问问李志飞曾经在接受采访时表示,大模型的关键在于如何把大模型用起来。
更多应用场景是推动大模型被广泛认知的有效渠道,反之,有限的应用产品也限制了大模型被认知的速度。
如果说技术、人才、财力和发展程度的差异是基层原因,那么这些原因造成有限的创业项目和应用场景,是导致大模型受限于“五环内”的直接原因。
“妙鸭”之所以火爆,其原因在于终于有一款面向普通人To C产品可以落地,且用途非常日常、门槛又低。只需上传图片后,静候生成结果是否与本人相像。其商业化路径也清晰明了,用户向大模型算力产生的结果单次支付费用。
而更多大模型创业更像是在做“困兽之斗”,要么是集中火力在To B应用层面发力,但To B产品似乎于推广大模型至“五环外”作用有限。要么是概念先行,一些看似花活较多的创意,却没有找到可持续的商业化路径。
正如朱啸虎认同李笛的观点:只做大模型不追求商业模式的公司难以生存。当年人脸识别出来也全在刷榜,刷到最后一无所有,榜单上任何一家都跟别人没太大区别。
在已经开始落地的大模型外,还有很大一部分是宣称自己要落地的、再等等决定何时落地的、以及是否落地还未可知的。它们就是前文提到的:大模型要有,至于是否还只是个概念?或有了大模型要怎样落地?怎样实现商业化?绝大部分企业还没有想好。这造成了大模型在“五环外”和“五环内”的“冷热”差异。
面对新行业,市场往往需要一个被教育的过程。有人把大模型创业浪潮比做曾经进入互联网时代般令人振奋。但冷静下来我们看到的是,大模型创业门槛明显更高,其市场推广与普及难度也更大。
行业内对大模型的了解程度参差不齐,普罗大众的认知更是断崖式地下跌。这样天差地别的差异,大模型距离全面走出五环外还道路且长。
诸如“妙鸭”一样的火爆产品再多一些,或许市场前进的步伐也能更快一些。