国产大模型厂商,正在一些局部能力上成功赶超 ChatGPT。
近日,弗若斯特沙利文(Frost & Sullivan)联合头豹研究院发布《2023 年中国大模型行研能力评测报告》,商汤商量、文心一言 3.5、讯飞星火等多款国产大模型均取得了接近甚至超过 GPT3.5 的得分。
数字行研作为一个小规模、不成熟的行业,对挤进榜单前列的几家厂商整体发展的影响似乎不大。不过,作为中国厂商全面布局的 AIGC 众多细分市场之一,这些厂商接近甚至超过 ChatGPT3.5 的能力表现,却是对其大模型卓越竞争能力的有力验证;也是他们通过各个细分领域 " 聚沙成塔 " 效应,实现业务稳健发展的一个支点。尤其是在 AI 大航海时代,AI 不仅成为各行各业转型升级的核心动力,也必然带来全球科技行业格局和秩序的重构。近日微软市值反超苹果,即是前兆。透过榜单纵观整个 AIGC 市场,商汤、百度、科大讯飞等中国大模型厂商,实际上已具备参与国际竞争,并竞逐未来 AI 时代全球科技领域少数几个领导者的能力。
新赛道," 中国队 " 集体反超
自 ChatGPT 爆火以来,生成式 AI 的颠覆性已毋庸置疑。没有人再追问何为生成式 AI,而是希望了解它究竟能给自己带来什么价值。
而金融行业应用 AI 技术撰写研报早已有之。早在 2018 年,一家名为 Kensho 的人工智能公司,就开发出一款 Warren 分析软件(取自沃伦 · 巴菲特),只需几分钟即可完成各类信息搜索和投研分析,为用户提供投资建议。相比之下,完全依靠人工操作的资产分析师团队,要完成这一过程,往往需要长达一周时间。
这种颠覆性的投研分析工具,不仅让 Kensho 赢得了华尔街 " 人神共愤 " 的名声,更让这家初创公司获得标普 5.5 亿美元的收购大单,成为当时人工智能领域最大的一笔收购交易。而再往前看,Kensho 的早期投资人中,更是不乏高盛、大摩、小摩、花旗、布雷耶、谷歌风投、恩颐投资等国际顶尖投资机构。
可见,对于数字投研的产业价值,国际投资界早已 " 用脚投票 "。之所以一直不温不火,大概还要归因于技术。
据沙利文指出,行业研究的行业特殊性、复杂性、严谨性,对内容生成和创作能力提出了多维度的高要求。而显然,以 ChatGPT 为代表的语言大模型的突破,成功解决了这一问题。业界至今仍记得,2023 年 2 月,财通证券发布的一篇由 ChatGPT 撰写的医美研报,刚一发布就迅速在金融圈刷屏,有券商分析师直呼:" 肯定会替代人工。"
众所周知,内容生成和创作能力是目前大模型最火热的应用场景。Gartner 预测,到 2025 年,企业 30% 的营销信息将会由大模型协助生成。数字投研恰好赶上了这一轮数字变革,从默默无闻一转身成为爆火的黄金赛道。这次由沙利文例举的 12 款大模型背后的研发厂商,堪称大模型 " 中国队 " 的排头兵,代表了中国大模型厂商的整体技术能力。譬如商汤科技,早在大模型热兴起之前,其已成为全球领先的 AI 软件公司。
根据沙利文报告,在这次榜单中,商汤语言大模型 " 日日新 · 商量 "(简称:商汤商量)以总分 7.73 斩获总榜第一,并在报告撰写能力(八大模块)、模型基础能力(行研基础能力)两个子榜位居第一,成绩明显高于 GPT3.5(7.29 分)。
除商汤之外,百度旗下的文心一言 3.5,也获得了 7.48 的总分,实现对 GPT3.5 的反超。科大讯飞旗下的讯飞星火总分 7.25,紧随其后,并在报告撰写能力子榜上获得 8.10 的得分,远高于 GPT3.5 的 7.58。
无论是商汤、百度的整体能力超越,还是科大讯飞的单项能力超越,都向我们传递出这样一个事实:中国大模型厂商,已经具备在数字行研这一新兴赛道参与国际竞争并占得优势的能力。
而作为内容生成领域的一个高门槛行业,这也意味着 " 中国队 " 在 AIGC 的其他赛道,同样可以占得一席之地。
构筑 AI 之塔的又一粒金沙
" 每个行业都可以重做一遍 ",是这波 AIGC 热潮中被重复最多的一句话。这句话其实包含两个方面,一是用大模型赋能改造各行各业,实现性能升级、服务升级,大幅提升产业效率,在此过程中实现大模型的商业变现;另一方面,则是依托大模型超强的智能化能力,创造新的智能化产品、服务,开拓新的赛道。
数字行研恰恰就是后者的一个典型例证。可以说,如果没有大模型这样强大的数字能力支撑,Kensho 式的小打小闹,也许很难形成如今刷屏金融圈的金融科技新赛道。
至于前者,微软、阿里、百度等国内外科技巨头,使用大模型工具对其自身及客户产品、平台功能的陆续改造,早已不是什么新鲜事。从行业发展来说,两者的 " 双路并进 ",带来了大模型相关行业快速增长的强劲动力。而从企业来看,这也要求他们不能拘于一隅,限制了自身的发展,而是要不断地拓展大模型应用领域,在现有的各行各业率先实现业务落地,站稳脚跟的同时,不断探索新的市场,才能真正实现自身业务的稳健、长期增长。
好在,从政策层到企业层,都已意识到行业落地的重要性,并正在积极推进。
2023 年 7 月发布的首部大模型监管法规《生成式人工智能服务管理暂行办法》,首先即明确了鼓励生成式人工智能技术在各行业、各领域的创新应用,探索优化应用场景,构建应用生态体系。今年两会期间,大模型的落地应用也成为代表讨论的高频词。
企业方面,就本次报告中几家领先厂商来看,在数字行研之外的众多领域,他们都已实现成功落地。据商汤介绍,截至去年 11 月底,商汤的语言大模型商量在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业,已经与超过 500 家客户建立了深度合作。
如果拓展到商汤公司在 2023 年 4 月发布的全系列生成式 AI 产品——商量、秒画、如影、琼宇、格物,商汤大模型产品的落地应用,正展现出强劲的发展潜能。根据商汤 2023 年半年报,公司生成式 AI 相关收入录得了 670.4% 的同比增长,对集团业务的贡献从 2022 年的 10.4% 迅速提升至 20.3%,AIGC 转型正呈现加速态势。国联证券研报认为,AI 大模型已开启商汤第二增长曲线。
从商汤的 AIGC 转型来看,大模型厂商的业务增长模式,恰如《法华经》中 " 聚沙为佛塔 " 的 " 童子戏 "。对于商汤、百度、科大讯飞等一众中国大模型厂商来说,在产业发展初期," 垒石为屋 " 式的发展往往会面临找不到石块的窘境,因而每一粒细沙都显得弥足珍贵。
可喜的是,面对潜力十足的数字行研赛道,他们没有错过这粒金沙。
" 大航海时代 " 的 " 小日记 "
按照科技行业普遍观点,某个技术超越科技奇点后就会产生科技大爆炸,围绕该技术的各类应用层出不穷,继而激活一轮新科技革命。显而易见的是,通过 GPT,AI 实际上已在 2023 年跨越了技术奇点。2024 年开始,AI 正在进入 " 大航海时代 "。
500 年前的那次大航海,不仅带来了 " 日不落 " 帝国在全世界范围的崛起,也酝酿了当今世界唯一超级大国的雏形,世界格局发生了翻天覆地的变化。对于 AI 行业这场新的 " 大航海 " 来说,其在全球科技领域深远影响也同样显而易见。因此," 每个行业都可以重做一遍 ",对如今的大模型厂商来说,既是机遇,也是挑战。产业渗透的进展,在各个细分领域的份额,直接影响到大模型厂商在未来科技竞争中的沉浮。
1 月 11 日,微软股价上涨,市值再次超过苹果,成为新年以来最受关注的事件之一,仿佛就是科技行业的一个隐喻。市场似乎认定了在大模型研发应用上走在了前面的微软,比迟迟不见动静的苹果公司,更有可能抓住未来科技领域最有价值的机遇,成为新的 " 日不落 " 和 " 美利坚 "。
幸而,中国的大模型厂商们,也已经造好了他们的海船。以本次报告中得分高居榜首的商汤为例,其在整个 AIGC 领域已构建起从算力基础设施到模型到应用的全栈布局,公司在 " 大模型 + 大算力 " 的战略下,通过 AI 大装置 SenseCore 打造出了具备自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力的 " 日日新 SenseNova" 大模型体系,催生了 AIGC" 新的研究范式 ",即基于一个强大的多模态基模型,通过强化学习和人类反馈,不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。在 " 日日新 " 大模型体系下,商汤创造出了一系列生成式 AI 模型及应用。
尤其值得注意的是,在 AI 算力需求指数式增长带来的算力短缺背景下,商汤对智能计算基础设施 SenseCore 大装置进行持续升级,算力规模达到 6ExaFLOPS,为这艘中国大模型 " 海船 ",提供了充足、可靠的动力。
环顾全球大模型厂商," 迪亚士 " 们率先启航,但也尚未走远;" 达伽马 " 们未来或许不一定能发现新大陆,但开辟出通往东方的新航线,也将在 " 日不落 " 帝国的崛起中发挥重要作用;" 麦哲伦、哥伦布 " 出发稍晚,但等在他们前方的,是最受瞩目的美丽新世界。一切都还只是刚刚开始,桂冠也不止一个,唯一的问题是:路在何方?
在如今大模型应用爆发的初期,应用领域挖掘不彻底、商业模式不完善是摆在大模型厂商面前的共同难题。要寻得这些难题的破解之法,只能在更多的应用领域进行长期深入的广泛探索,从中总结经验,发现规律。数字行研本身只是大模型无数应用领域中微不足道的一个,但它对各家厂商们的价值,或许正在于此。
让我们再次回想 500 年前,当哥伦布来到美洲时,他仍在自己的航海日记中,书写着在他看来稀松平常的见闻。但直到今天,我们都知道,这位空前伟大的航海家,不经意间已经记下了欧洲人登陆新大陆的伟大时刻。在数字行研领域 " 集体 " 反超 GPT3.5 的成果,或许也可以看作中国大模型厂商们,记下的一篇稀松平常的 " 航海日记 "。我们期望,终有一天,在大模型发展的漫漫航程中,中国厂商们,也将迎来自己的 " 登陆时刻 "。