本报记者 李玉洋 上海报道
忽如一夜AIGC来,千模万模竞相开。对于眼下爆火的国内AI大模型赛道,套用这句唐诗来形容十分应景。
近日,36氪爆料称小红书入局AI大模型,从3月起筹备了独立的大模型团队,同时其内部还有多个独立部门推进AIGC方向的落地探索。对此,《中国经营报》记者向小红书方面求证,该公司回应表示对上述消息不做评论,至于对AI大模型技术的态度以及该技术对于公司的业务发展会有哪些促进,截至发稿前,小红书方面未回复。
记者注意到,今年5月份以来,包括科大讯飞、万兴科技、中文在线、云知声等也推出或官宣入局大模型赛道。在AI大模型赛道上,截至目前,不仅百度、阿里巴巴、腾讯、华为等国内互联网科技大厂置身其中,商汤科技、知乎、浪潮、昆仑万维、蓝色光标等独角兽企业或传统上市企业也纷纷加入,如此多的国内企业声称要做AI大模型,以至于被业内一些人士称为“百模大战”。
基于“百模大战”的现状,我们是时候需再考虑再复盘“大模型是什么?它是一种更偏向软件还是硬件的技术?又能给企业带来什么?”等问题了。
对此,原中科院计算所上海分所所长、豪威研究院院长孔华威对记者表示:“大模型以软件技术为主,是新一代操作系统,类似Android和iOS。”他还提到,大模型是快速嵌入式的个人助理,就像手机,而大模型的发展,意味着企业效率革命的真正到来,就像电商对于企业、美团对于饭店。
“作为技术发展的趋势,大模型已经是互联网企业绕不开的技术。对于这项技术,有条件的企业当然越早布局越好。”中国社会科学院数量经济与技术经济研究所助理研究员端利涛向记者指出,大模型技术的出现势必会推动商业模式的转变,这将是一片全新的蓝海。
在大模型研发上国内有机会追赶
OpenAI旗下应用ChatGPT掀起的GPT浪潮,让人工智能再次火热了起来,或者说属于AI的2.0时代到来了。
“AI本身可认为是纯粹的软件技术,包括各种GPT都是。”长期关注AI行业发展的观察人士黄烨锋表示。根据腾讯科技的报道,多语言多领域自然语言处理(NLP)资深架构师、Trend首席科学家李维博士认为:“算法就是模型。”
端利涛也认为,大模型可以说是一种算法,其具有上千亿甚至万亿的参数,这种参数上的规模是传统模型所无法比拟的,这是一种超大规模的软件。综上来看,大模型相对来说更偏向软件技术。
“在OpenAI证实了大模型的威力之后,说明这条路已经走出来了,后来者赶上只是一个时间的问题。”李维博士表示,虽然在具体的实践中会有一些细节不相同,但算法在大层面上是学术界共享的。
中国开源软件推进联盟副秘书长李震宁也表示,开源打破了技术壁垒,将进一步广泛推动AI技术的市场化。近期因翻唱《好汉歌》《爱在西元前》等经典曲目而火遍全网的“AI孙燕姿”,凭借天后音色,直接成为AI翻唱的新宠儿。
据了解,作为“AI孙燕姿”背后的技术支撑,So-vits-svc(也称Sovits)是由中国歌声合成爱好者Rcell在VITS、soft-vc、VISinger2等一系列项目基础上所开发的一款开源免费AI语音转换软件。用更通俗的话来说,如果说ChatGPT是文字领域的AI,那么Sovits就是语音方面的AI。
开发者可以用现有的声音来投喂训练Sovits,产生一套语音系统。投喂具体是指,使用素材,让AI学习模仿,不断训练强化AI。比如说,给Sovits听孙燕姿的声音、气息和咬字,Sovits慢慢会学会孙燕姿的声音、表演风格和特点,形成一套可以进行塑造的语音系统。需要指出的是,在开源社区GitHub上,Sovits目前还只能被读取。
开源对于推动AI的发展意义重大。哪怕AI研发实力强劲的谷歌,也意识到与开源AI竞争将难以占据优势。据外媒semianalysis报道,谷歌研究员在一份泄密文件中指出,谷歌没有护城河,OpenAI也是如此,与开源AI竞争将难以占据优势。
该泄密文件还提到,开源模型训练速度更快,可定制性更强更私密,而且比同类产品能力更出色。“他们正在用100美元和130亿的参数做一些‘谷歌1000万美元和540亿的参数难以企及’的事情,而且在短短几周内就能做到,而不是几个月。”该泄密文件指出与开源直接竞争是赔本生意。
再回过头来看,为什么那么多国内企业入局大模型,掀起“百模大战”?原因在于大模型的技术门槛相对而言没那么高,至少能很快上手,一是大模型更偏向软件,经过多年发展,国内软件人才没那么紧缺;二是受益于开源,很多AI项目都能被开发者使用。
“总体上,从国内已经经历过大模型研发的团队的报告来看,只要按照他们的路线走,大都搞定了语言模型的理解和生成能力,甚至达到了篇章对话、思维链、多任务等重要指标。因此,从算法方面来说,总体上来说是可以追赶或者复制的。”李维博士告诉记者。
越早布局越好
作为国内AI大模型的先行者, 3月下旬,百度文心一言也上线了AI作图功能,也引发了业内的广泛关注和讨论。百度方面称,“文心一言完全是百度自研,文生图能力来自文心跨模态大模型ERNIE-ViLG”,并表示目前文心一言仍需“通过训练进一步调优迭代”。
随着众多国内企业纷纷抢滩入局AI大模型,业内也出现了套壳换皮等的一些担忧。
“如果是换皮的模型,那么百模大战没意义。”孔华威表示,需警惕企业只讲应用、薅“开源”羊毛来做AI大模型的声明和姿态。李震宁也表示,丰富的应用场景是国内企业入局AI大模型的优势未来也要重视模型算法等核心能力的自主创新。
不过,大模型已成为发展趋势。“和之前火爆的应用不太一样,例如去年的元宇宙,关于元宇宙的讨论非常激烈,对未来的憧憬也十分饱满,但短时间内落地是个大问题。”端利涛表示,大模型技术和元宇宙不一样,当前的“百模大战”还谈不上过热,因为它已经在一些场景中实现了应用,并可以带来收入。
比如微软把ChatGPT嵌入到office全家桶里,谷歌把AI能力嵌入到了搜索引擎本身,这些操作都显著提升了原产品的体验效果,为它们带来了收益。此外,端利涛还指出,生成式AI在代码编程、金融分析、医学、教育等领域都显著提升了效率并改善了用户的体验。
正如阿里巴巴集团董事会主席兼首席执行官张勇在2023年阿里云峰会上所说:“所有的行业、软件以及服务都值得基于新型的人工智能技术重做一遍,这不仅会带来创新性的客户体验,同时也会让我们的生产、工作、生活范式发生变化。”
百度创始人、董事长兼首席执行官李彦宏则指出: “大模型时代,最大的创业机遇在应用端。移动互联网时代,操作系统其实没几个,最成功的是微信、抖音、淘宝这些应用。”而创新工厂董事长兼CEO李开复指出:“最早使用AI工具的人,往往最早发现其中的机会所在。”
端利涛表示,作为技术发展的趋势,大模型已经是互联网企业绕不开的技术。对于这项技术,对于有条件的企业当然是越早布局越好。
“美国对华一些不公平的政策已经限制了我国相关领域的发展,已经入局大模型的国内企业会受到严重阻碍。”端利涛表示,在大模型领域,国内企业只能把有限的条件发挥最大的价值,加大对模型(算法)和芯片的研发投入,尽可能地抓住一切可以利用的机会发展自身。
同时,他也建议政府相关部门尽快完成国内各类数据的整合、电子化和开放共享,让国内大模型领域的企业能够拥有更有利的发展环境。