大模型B端混战,阿里云升级通义千问打生态牌
华夏时报(www.chinatimes.net.cn)记者 卢晓 北京报道
作为这轮AI浪潮的核心,大模型热潮一直持续,今年年初国内科技公司发布的大模型们也都在持续升级。
10月31日,阿里云在云栖大会上发布了千亿级参数规模的大模型通义千问2.0,当天通义千问APP也在各大手机应用市场正式上线。与此同时,阿里云CTO周靖人还在2023云栖大会上宣布,拥有720亿参数的通义千问72B模型即将开源,这也将成为中国参数最大的开源模型。当天,阿里巴巴集团董事会主席蔡崇信还表示,“我们要打造AI时代最开放的云。”
在开放背后,大模型在B端市场的商业化一直是外界关注的热点。但它实现的前提是,首先要有一个庞大的AI大模型生态。
通义千问升级
历时6个月,阿里云正式发布了大模型通义千问2.0。
记者从阿里云方面了解到,相比今年1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有提升。阿里云提供的数据还显示,在MMLU、C-Eval、MATH等10个主流Benchmark测评集上,通义千问2.0的得分整体相比OpenAI的GPT-3.5是九胜一负,相比GPT-4则是四胜六负,差距进一步缩小。
阿里云也期待更多行业大模型在通义千问上产生。据记者了解,为推动通义千问大模型在千行百业集成落地,阿里云还基于通义千问“打样”了AI阅读助手、智能编码助手等8个行业大模型。用户可以在官网直接体验模型功能,开发者则可以通过网页嵌入、API/SDK调用等方式将这些模型能力集成到自己的大模型应用和服务中。
事实上,今年4月发布通义千问1.0版本时,阿里云就已经在期待这个超大规模语言模型在B端市场的价值。“所有软件都值得接入大模型升级改造,”周靖人当时称:“我们将开放通义千问的能力,帮助每家企业打造自己的专属大模型。”阿里自身业务当时也率先被拿出来试水打样。继钉钉和天猫精灵率先接入测试后,阿里电商、搜索、导航、文娱等场景也陆续接入。
通义千问的开源战略也在持续。10月31日,阿里云宣布通义千问72B模型即将在11月开源,而在此前,通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat在今年9月已经免费可商用。而在今年8月,阿里云还已开源通义千问70亿参数模型Qwen-7B,一个多月累计下载量破100万。
“目前,中国有一半大模型企业跑在阿里云上,280万AI开发者活跃在阿里云魔搭社区上,未来,阿里云将携手千行百业推动AI创新,共享技术红利。”周靖人说。据记者了解,百川智能、昆仑万维、vivo等多个公司或机构均在阿里云上训练大模型。据悉,魔搭社区是阿里云于去年云栖大会时牵头建设的AI模型开源社区,目前AI模型下载量已突破1亿。
降低大模型门槛
不只是开源,面临成本、技术、人才等拦路虎,让各行各业开发、部署大模型越来越简单,已经成为包括阿里在内的基础大模型企业们近来频频对外传递的积极信号。
据记者了解,今年3月在国内率先推出AI大模型的百度在今年9月将自己的文心大模型升级到了4.0版本,百度创始人李彦宏当天演讲的主题则是“手把手教你做AI原生应用”。腾讯云此前也推出了一个行业模型商店,并称将便于用户快速生成自己的专属模型。
阿里云开发的一站式大模型应用开发平台——阿里云百炼也在10月31日对外亮相。阿里云方面告诉记者,该平台为用户简化了底层算力部署、模型预训练、工具开发等复杂工作。开发者可在5分钟内开发一款大模型应用,几小时即可“炼”出一个企业专属模型。
事实上,包括阿里云在内,基础大模型厂商们基本都遵循着先普及应用、建立起生态再提商业化的路径。事实上这也是每一代科技浪潮的竞争套路。今年9月周靖人在谈及商业化问题时还曾表示,“我们认为,今天在模型这部分应该先注重生态,然后再注重商业化,而不是说一开始就过度围绕商业化。”
10月31日,他在云栖大会上再次表示,“促进中国AI生态繁荣,是阿里云的首要目标。阿里云将坚定打造AI时代最开放的大模型平台,我们欢迎所有大模型接入阿里云百炼,共同向开发者提供AI服务。”
对于行业大模型的门槛日益降低,深度科技研究院院长张孝荣对《华夏时报》记者表示,对于普通企业用户来说,价格已不再是部署大模型的难题,安全隐私、准确性、知识实时性、生成随机性等因素才是。周爰咨询合伙人杨思亮也对记者表示,除了价格外,普通企业用户的大模型部署还受到模型大小、推理速度、数据隐私、版本迭代以及应用场景是否丰富等多个因素的制约。
不过AI大模型的生态比拼显然并不在于这一时。中国工程院院士、阿里云创始人王坚在10月31日的发言中称,人工智能和云计算的结合带来云计算的第三次浪潮,它不会在一年、两年完成,它可能会给我们十年、几十年的时间,让足够多的创新,在云计算时代能够发明出来。