当前位置:首页|资讯|AI大模型

关键词·半年报 | 走过“冰与火”的半年 AI大模型“追光的日子”还能持续多久?|封面天天见

作者:封面新闻发布时间:2023-07-20

原标题:关键词·半年报 | 走过“冰与火”的半年 AI大模型“追光的日子”还能持续多久?|封面天天见

封面新闻记者 欧阳宏宇

火了近半年的AI大模型,分野逐渐多了起来。

7月19日,阅文集团在成都发布网文行业大模型“阅文妙笔”。据介绍,该大模型旨在为网文作者解决世界观设定、角色设定、情景描写等,创作中重复性、消耗性的“体力活”。就在两天前,携程也发布了旅游行业垂直大模型“携程问道”;加上天眼查推出的商查大模型“天眼妹”,云鼎科技联合华为云研发的能源行业商用AI大模型“盘古矿山”,聚焦于健康、金融、电商领域的京东言犀大模型,中国移动上线的“九天”系列海算政务、客服大模型……仅仅在7月,头部企业就拿出了近10款行业大模型产品,为“百模大赛”后半程定上了牵手产业场景的基调。

数据显示,目前我国参数规模在10亿以上的大模型数已达79个,自然语言处理、多模态为重点落地领域;后者也是推动各垂直行业智能化升级的基础设施。

但在大厂携AI大模型落地行业场景背后,二级市场相关板块的热度也在骤然降温。最近一个月,A股ChatGPT概念指数已较6月下旬的高点回落15.15%。一边是仍在狂飙突进的AIGC,一边是逐渐回归理性的市场,AI大模型的未来将何去何从?

企业争推行业大模型

唯落地产业场景是瞻

和让AI帮助人类修图片、写周报、订机票类似,协助作家写作的AI大模型,主要也是瞄准了,解决特定场景中枯燥重复性工作的痛点,提高工作效率。

在阅文集团副总裁黄琰看来,针对网文写作研发的行业大模型,可以通过平台积累的创作经验和数据,辅助作者完成世界观设定、角色设定、情景描写和打斗描写。“比如,通过世界观设定功能,帮助作者完成武力值、地图、门派势力等多重细节的完善。”

事实上,聚焦于C端的AI大模型所发挥的作用也越来越具体。例如,“携程问道”大模型就集合了平台上百亿的旅行数据,辅助用户进行旅行目的地、酒店、景点预定与行程规划决策;“天眼妹”致力于为用户提供“可信数据+可信算法”的商查服务,解决通用大模型在商业信息搜索中张冠李戴的痛点;WPS AI则主要用于办公场景中会议纪要、周报、市场文案等内容的撰写。记者粗略统计发现,目前,AI大模型已经进入了办公、制图、视频、旅游、写作、商查、采矿、金融、传媒、政务等10余个行业领域。

事实上,更早之前推出的文心一言、通义千问等也可以解决这些问题,但具体到特定的行业与场景,通用大模型则难以真正理解抓手之所在,因而对工作效率的提升有限。

“通用大模型不会一统天下,用户需要不同的‘机器大脑’。”印象笔记CEO唐毅此前在接受采访时分析到,通用大模型的通用也可以理解为没有个人特色,不会对用户形成的知识、对世界的认知、积累的信息有任何形式的反应。同时,由于通用语料和专用语料不一样,所以用户、企业所积累的独有数据,一定是在专用模型里呈现。

360集团创始人周鸿祎也认为,大模型未来的机会是企业、行业级市场。他尤其提到,公有大模型有很多的不足,首当其冲在于是个“通才”,因而缺乏行业深度。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生则预测,通用大模型可以在100个场景中,解决70%至80%的问题,但未必能100%满足企业某个场景的需求,所以,行业大模型是企业拥抱大模型的更优选项。

从文心一言到“千模大战”

大模型经历“冰与火之歌”

从通用迈向行业,国产AI大模型并非一蹴而就。一路走来,经历了多个发展阶段。

今年3月16日,百度率先推出了大语言模型产品文心一言,涵盖文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等多种能力。现场,百度创始人李彦宏预测,多模态是生成式AI一个明确的发展趋势。也就从那一天开始,A股ChatGPT概念指数摆脱了横盘期,在不到三个月的时间里,从不到1300点大涨了超40%。

一个月后,阿里通义千问大模型旋即登场。该AI大模型虽然以通用大模型的形式推出,但在发布会现场,阿里云智能集团CEO张勇对外表示,阿里巴巴所有产品未来都将接入“通义千问”大模型,进行全面改造。自此,中国造大模型从通用开始进入场景应用和落地:华为、京东、科大讯飞、网易、知乎、金山办公、美图、天眼查等大厂推出的AI大模型,都聚焦于其擅长的行业中,比如,网易聚焦于游戏、知乎落脚于问答、美图发力于视觉。

直到国内AI百模大战打了三个多月,腾讯才宣告入局。6月19日,腾讯云对外公布其大模型的研发进展,并明确表示将为合作伙伴提供MaaS一站式服务,助力构建专属大模型及智能应用。这意味着腾讯将是BAT中唯一一个没有通用大模型产品的企业,而只作为技术底座赋能其他企业。此外,文心一言和通义千问也公布了其落地行业场景应用的成绩单。

从通用大模型到行业大模型,再到专属大模型,这背后的逻辑是,企业越来越意识到,AI大模型的价值是解决具体场景的需求,即只要产品够好,用户不会关注技术底座到底是什么。

不过,也正是在腾讯公布大模型研发进展后的第二天,A股ChatGPT概念指数遭遇重挫:连续两个交易日跌去了近15%。在大洋彼岸的ChatGPT也在这期间遇冷。据网络数据平台Similarweb统计,ChatGPT网站在今年6月的访问量环比增速为-9.7%,而在今年1月这个数字还高达131.6%;同时,Civitai、Claude等同类产品也都未能幸免,Civitai的访问量从3月开始不断缩水,平均访问时长仅有14分钟。

仅半年的时间,AI大模型就经历了过山车式的行业,业内人士分析称,在大模型发展初期,企业只顾着和时间赛跑,拼速度,抢流量红利;等到潮水褪去后,企业就要面对应用问题。具体而言,如C端大模型在刚上线时能帮企业积攒人气,但从长期来看,则未必能为企业创造可持续的收入。

例如,上车不久的知乎通过知海图AI、搜索聚合两款AI大模型来丰富问答内容,并已内测了热榜摘要功能,但这些功能内测至今也未能在其站掀起合乎预期的热度。毕竟,AI可以提供正确答案,但无法模拟人类个性化的文风与表达。

商汤智能产业研究院院长田丰认为,按照Gartner此前发布的新兴技术成熟度曲线,每一个新兴技术会经历“技术萌芽期”、“期望膨胀期”、“泡沫破裂低谷期”、“稳步爬升复苏期”四个阶段。AI大模型在“期望膨胀期”时被寄予高度重视,随着“泡沫破裂低谷期”到来,就会面对真正的行业垂直场景进行技术标准化、原型产品优化、服务规模化,形成价值闭环,未来,还会在“稳步爬升复苏期”进一步茁壮成长。

大模型将走向何处?

通用与行业结合将是方向

当AIGC开始“挤泡沫”,是否意味着才火了半年多的大模型快不行了?

“目前看,聚焦行业垂直应用的大模型,能与业务结合,可形成商业模式,有发展潜力,是一条比较好的路径。”北京社科院研究员、南昌理工学院数字经济研究院院长王鹏解读到,从技术发展的逻辑上看,企业纷纷投入大模型训练,只是为了占据制行业高点,这也没有错。

北京社科院研究员、南昌理工学院数字经济研究院院长王鹏

在王鹏看来,行业大模型是企业在加码通用大模型一段时间后,退而求其次的选择。通用大模型虽然应用成本相对较低,但投入成本高,并不适合于所有企业。站在实际操作层面,很多在早期阶段做通用大模型训练的企业,在研发了一段时间后,会遇到模型训练不出来,投入产出不成正比,回报遥遥无期等问题,在这样的情况下,就转向研发自己擅长领域的行业大模型。

和云服务类似,从发展趋势看,“通用+行业+专属”三种不同维度AI大模型产品的结合更符合市场所需。今年5月发布的《中国人工智能大模型地图研究报告》也指出,我国大模型呈现蓬勃发展态势,国内通用类大模型正在持续拓展应用领域,打造跨行业通用化人工智能能力平台,其应用行业正在从办公、生活、娱乐向医疗、工业、教育等行业加速渗透。同时,垂直领域专业类大模型也在不断深化落地,提供针对特定业务场景的高质量专业化解决方案。

“大模型的发展将是行业大模型、通用大模型,和垂直应用相结合。”王鹏也认为,未来的应用格局是,有资源和实力的大企业做通用大模型;有产业资源、行业数据的企业做行业大模型;聚焦中小场景的中小厂商,依托于头部企业研发的AI大模型来做应用。

在这种情况下,今年下半年也将是国产AI大模型的洗牌期。“今年上半年是千模竞发,到下半年,可能就会有一些企业和行业退出。”在王鹏看来,大模型训练的门槛会自然地推动赛道产生的分流,届时,无法形成正向的商业闭环,或者没有应用场景和付费场景的AI大模型将会被淘汰。

在不少分析人士看来,目前已是国产AI大模型的顶峰,未来AI大模型的泡沫将渐渐退去。王鹏也提醒,过去几个月中,大模型和AI结合推动的股价上涨只是短期行为,行业还是应从长线角度去看大模型。

“大模型是久久为功的结果。”王鹏以OpenAI为例谈到,ChatGPT也是训练了三四年,植入了大量的数据才产生的,所以这不是个立竿见影的赛道,需要长期积累。“就下半年来看,行业也不会像上半年一样,只要和大模型题材沾边,就能做高估值,反而市场会越来越理性。”


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1