当前位置:首页|资讯|清华|生成式AI

大模型的新战场

作者:钛媒体APP发布时间:2023-09-08

原标题:大模型的新战场

图片来源@视觉中国

文 | 定焦,作者 | 温故,编辑 | 方展博

9月5日一早,北京国贸大厦,这座北京CBD核心区曾经的最高楼,A座一层入口处挤满了人。两位保安拉出隔离绳,切开两条道,才勉强维持住秩序。

进门有两个签到台,左手是媒体,右手是嘉宾。临近9点活动正式开始的时间点,还有人源源不断前来。他们都是来参加一场由百度公司举行的大模型会议。

五天前,百度刚宣布文心一言向全社会全面开放,所有人都能注册使用,而不用再申请内测名额。这是国内第一个通过监管备案的大模型产品。

这场会议,吸引了来自全国各地的人。因为人数实在太多,在开场前三分钟,现场关闭了通往三层主会场的通道,然后引导参会者前往旁边的嘉里大厦分会场,那里有大屏幕可以看直播。

会议签到现场 「定焦」摄

分会场的座位没多久也全部坐满了,中途还不停有人进来。一位从外地赶来的从业者盯着屏幕嘟囔着,这次不能在现场见到李彦宏了。

作为中国对AI投入最早的大厂之一,百度踩上了新一波AI浪潮,这让它在业内的关注度快速上升。

但竞争也无比激烈。就在会议开始前半小时,科大讯飞宣布,讯飞星火认知大模型面向全民开放。没多久,讯飞星火APP登上了苹果应用商店免费排行榜的榜首。此前,刚拿下榜首的是文心一言。

百度董事长兼CEO李彦宏说,模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义,对于创业者来说,“卷大模型没有意义,卷应用机会更大”。

从内测走向开放,从拼参数到拼应用,中国大模型进入新战场。

等待发令枪响

对于中国的大模型厂商而言,8月31日是很特殊的一天。这一天,北京、上海率先通过了大模型备案。

所谓大模型备案,是指大模型产品在向公众开放及商用之前,必须拿到监管部门的备案审批。没有经过备案,就只能小范围内测,大部分人无法注册使用。

百度早在3月16日就发布了文心一言,后来阿里发布通义千问,科大讯飞推出讯飞星火,这些大模型之前一直在内测阶段。即便用户下载了APP,也无法注册账号。

目前,有两条跟AI产品备案相关的政策法规,一是1月10日开始施行的《互联网信息服务深度合成管理规定》,二是8月15日开始施行的《生成式人工智能服务管理暂行办法》。

政策规定,生成式AI产品上架之前,一要进行算法备案,二要通过安全评估,业内称为“双新评估”。这可以被视为大模型应用进入市场的门槛。

一家AI创业公司的创始人对「定焦」说,几个月前,很多企业就启动了算法备案,有些企业还主动跟监管部门沟通,了解安全评估的要求,以尽早通过备案评估。

国内的AI大模型集中发布于四五月前后,《生成式人工智能管理办法》在4月11日发布征求意见稿,8月15日开始生效。这四个月的时间里,很多企业赶在生效前申请,想要率先拿到审批。

通过备案对厂商很重要。一方面这是产品推向市场的前提条件,另外,它在某种程度上代表官方认可,是一种无形的背书。目前备案以地域划分,因此各地监管部门都在加速审批,企业也在等待通知,随时准备对外宣布进展。

8月31日凌晨,0点刚过,百度通过公众号对外宣布,文心一言向全社会开放。在新闻稿中,百度特地用到了“率先”一词。

“百度是提前准备好了的,相关部门允许上线的时间应该就是8月31日。”一位AI大模型创业者说。

卡着点官宣,让百度成为备案政策生效半个月以来,第一个正式通过备案的企业。北京也跑在了其他城市的前面。

紧接着在凌晨3点,百川智能也宣布通过生成式人工智能备案,即日起开放公众服务,它也用到了“率先”一词。

清华系AI公司智谱华章也通过了第一批备案,但它直到31号下午6点多才对外宣布,上线了一款生成式AI助手“智谱清言”,APP和微信小程序都能体验。它是第一批里面唯一一个推出了小程序的公司。

另一个抢跑的城市是上海。

总部在上海的AI公司商汤,在31日中午12点半宣布,大语言模型应用“商量SenseChat”即日起开放服务;MiniMax在下午3点多,正式宣布“abab”大模型全面开放服务。

24小时之内,通过备案的企业纷纷主动官宣,刷一波存在感。

市场普遍认为,第一批通过备案的大模型公司至少有8家,其中北京5家(百度的 “文心一言”、抖音的 “云雀”、百川智能的 “百川大模型”、智谱华章的 “智谱清言”、中科院的 “紫东太初”),上海3家(商汤的 “商量 SenseChat”、MiniMax 的 “ABAB 大模型”、上海人工智能实验室的 “书生通用大模型”),另外广东的2家和安徽的1家会陆续开放。开放的时间取决于各省市的审批进度,而且各省市的名额有差别。

安徽的那家是科大讯飞,直到9月5日才宣布通过备案,比北京和上海的几家企业晚了近一周时间。而被认为会在第一批备案名单里的阿里“通义千问”、360智脑,目前尚没有更多消息。

寻找爆款应用

监管放开备案,给大模型厂商们开辟了一个新战场。

之前,由于没法开放注册,厂商们只能在圈内刷存在感,通过霸榜一些国际测评榜单,来证明自己技术实力优秀。现在,C端用户都能使用了,竞争更加市场化,是骡子是马拉出来溜溜,优劣更容易评判了。

用户争夺战率先打响。

根据百度发布的“战报“,文心一言开放首日,APP迅速登顶手机应用商店排行榜,开放下载19小时内用户突破100万,累计回答网友3342万个问题。

讯飞星火APP开放下载当日,也登上了苹果应用商店免费排行榜的榜首。科大讯飞发布“战报”,讯飞星火上线14小时用户突破100万。这个速度超过了文心一言。

不过,这其中有多大“含金量”难以判断,热度能持续多久更是存疑。

当用户涌入之后,产品体验、运营、服务的重要性上升。但不是所有厂商都准备好了。

第一批备案名单里的商汤SenseChat,称所有用户都能注册使用。但是当你打开它的官网,会发现无法注册,页面提示“抱歉,当前注册人数过多”。

算力依然制约着大模型应用的推广。

盛景嘉成董事总经理刘迪对「定焦」分析,现在算力非常稀缺。“用来做微调和日常的B端业务处理都已经很紧,C端的量一旦上来,有些公司会支撑不住。”

百度在文心一言放开后的第12个小时发通知称,正在调集新的算力,“请大家减少调戏,为工作和学习目的的用户让路”。

这跟移动互联网早期的情况类似,高并发对服务器的要求很高,可能导致网站崩溃,而大模型对算力要求更高,为之付出的成本更加高昂。

AI生成信息的准确性也是个问题。

即便是准备最充分的百度文心一言,也还是避免不了“幻觉”现象。有人问它“2023年每个月的汽车出口数据”,它一本正经地把今年剩下四个月的数据都列出来了。

多位从业者认为,短期内出现爆款应用的概率不大。

启明创投合伙人叶冠泰对「定焦」说,监管放开是个重要时点,但不会马上出现爆款应用,因为目前大模型还是通用并且不实时,需要有一点沉淀的时间。从一个尝鲜的角度,用户量会涨很快,但不会持久。

前段时间“妙鸭相机”刷屏,成为国内第一个面向C端的、收费的、刷屏的AIGC应用,让中国的大模型厂商看到了希望。但这款产品最终昙花一现,热度只持续了一周时间。

不过对于厂商们而言,这或许不是那么重要。厂商看中的是用户数据。李彦宏说,当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言。

在赚走一波热度后,厂商们有更大的野心。

开始养家糊口

放开C端注册之后,大模型厂商憧憬着,通过C端赚钱。

ChatGPT已经为行业打了个样。今年2月, ChatGPT 推出Plus付费项目,起价为每月20美元。这类似订阅制,Plus会员能调用GPT-4版本,享受更快的相应速度,优先获得新功能。当时ChatGPT的注册用户已超过1亿人。

当用户规模足够大,用订阅模式赚钱,是一种很成熟的商业模式。但在中国,用户的付费意识还需培养。

“C端的会员订阅在国内不太现实,互联网产品过去就没有培养起C端付费的市场。”跃盟科技创始人王冉说。

现在讲大模型在C端的产品形态,包括变现方式,似乎还有点早。厂商们对产品的定义也还没有那么清楚。

事实上,大部分大模型厂商,包括OpenAI在内,商业化主要还是通过to B的方式——出售大模型API(应用程序编程接口),按调用次数收费;输出大模型解决方案,赚开发服务的钱。

面向B端(开发者和企业)的API接口调用,一直都是OpenAI的重心。早在2020年,OpenAI就开始进行API接口邀请测试,一些搜索公司、教育公司、社交媒体公司成为OpenAI最早的客户,它们调用GPT的API,将OpenAI的软件集成到他们的产品中。

8月28日,OpenAI上线企业专用版本的ChatGPT。这个版本针对企业客户的需求,在功能上做了更深层的定制,目前没有对外公开价格。OpenAI称,接下来还将针对小型机构推出ChatGPT商务版本,并提供更多定制化选项。

从OpenAI的布局能看出来,它一直在B端市场发力。ChatGPT对OpenAI的意义,目前不是商业化变现,而是在于打响知名度,证明技术实力,并由此抬高公司估值。过去几个月,OpenAI又完成了巨额融资,员工数量扩大了好几倍。

国内厂商借鉴了这一思路。百度文心一言、讯飞星火认知大模型,先后冲榜苹果应用商店,像电商平台在“双11”发战报一样做宣传,都是为了引发外界关注。

毕竟,没有什么方式比做出一个爆款应用,更能证明公司的技术和产品实力。

即便短期打造不出爆款应用,向C端开放也能促进B端生意的增长。

一家做系统集成公司的员工对「定焦」说,百度的千帆大模型刚上线时,他们就拿到了接入的名额。这是一个面向B端的企业级大模型平台,可以调用文心一言的服务,也可以开发、部署和调用自己的大模型。

但当时文心一言在内测,他们跟客户合作开发时,拿账号要走内测的内部流程,相对麻烦。现在放开使用后,“用的人多了,客户更了解这个产品,会有一些新需求出来,更利于我们开展业务。”

一位百度智能云生态企业的员工对「定焦」说,“C端放开注册,会让更多人知道大模型,先有C端体验,然后促进B端使用。”

现在,国内的大模型厂商在对外秀肌肉时,不再强调大模型的参数和性能,而是更突出签约客户的数量、落地的行业和场景。它们变得更加务实。

摸着自己过河

通过了备案,中国大模型厂商们接下来面临的最大挑战,是这条路没有人走过,它们得摸着自己过河。

美国的OpenAI走过的路、掀起的热潮,在国内无法直接复制。

在中国放开大模型审批之前,美国以ChatGPT、Character AI为代表的产品,已经在全球多个国家开放使用,ChatGPT在两个月内狂揽1亿用户,后来者Character AI的首周下载量超过了ChatGPT。

但经历完早期几个月的流量暴涨,ChatGPT略显疲态。根据第三方机构SimilarWeb的监测数据,从4月开始,ChatGPT的环比增长开始放缓,5月几乎没有增长,7月用户数量从6月的17亿人降至15亿人,环比降幅达到12%。

这说明看热闹的人少了,普通大众对AI大模型的关注度在下降。

之前无论投资圈还是产业界,都在说要做“中国的OpenAI”,现在大家开始考虑,做出什么样的应用,能够真正解决产业问题和用户需求。

一些人说要做AI原生应用。按照李彦宏的说法,AI原生应用不是对移动互联网APP和PC软件的简单重复,而要能解决过去解决不了、或解决不好的问题。

这就像当年从PC互联网到移动互联网过渡,那些真正爆款的应用,都是押注移动互联网,在新的技术平台开发,而不是对PC产品的修修补补。典型的例子是微信的崛起。

现在大家相信,依靠大模型的能力,或许能开发出完全不一样的新应用。

一位AI创业者说,真正的AGI原生应该是用AGI的推理能力重新组织业务的关键流程,进而重构产品形态和人机交互。如果仅仅是用AGI里的AIGC功能生成内容和文本,那只是改变内容的生产效率,新酒装老瓶。

押注新技术和新平台的风险也是巨大的。跟移动互联网刚兴起的时候相比,现在最大的变化是流量红利消失了,新应用的推广成本非常高。大厂或许可以借助现有的超级APP导流,创业公司突出重围的难度增加。

英诺天使基金管理合伙人王晟对「定焦」分析,在C端市场,现在无论是打造一款用户规模很大的应用,还是一个新的生态平台,都非常困难。“系统性流量红利没有了。”

在商业化路径相对清晰的B端市场,由于OpenAI的产品没有进入中国,给中国厂商留下了一定的时间窗口。

一位做AI招聘的创业者对「定焦」说,他们的产品一开始接入了ChatGPT的接口,随着国内大模型放开,正考虑更换成国内大模型。“现在有些客户尤其是有一定政府背景的,他们还是比较在意这一块”。

王冉对「定焦」表示,接下来大模型会在垂类场景里不断优化,技术公司或产业领域的头部企业,大概率会做自己的专用模型。一些行业会形成行业模型和大模型混用的局面,私域模型占主导,公域模型做协调配合。

在这个过程里,业务数据会成为稀缺资源。“AI大模型的核心不是AI本身,跟业务结合是最难的事。随着一些大模型开源,越来越多的公司会自己做百亿参数规模的大模型,真正值钱的不是参数,而是业务数据和行业knowhow,这是所有大模型公司都在抢的东西。”王冉说。

一个新的共识是,随着大模型放开,行业会重新洗牌,有些大模型会被淘汰出局。流量逐渐向头部集中,不同梯队厂商之间的差距进一步拉大。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1