作者 | 邓咏仪
编辑 | 苏建勋
10月,可以说是国内大模型领域的一场小考,好不热闹——从腾讯、讯飞、智谱、百川,各家大模型厂商纷纷拿出通用大模型的新版本,试图一较高下。
本月最后一天,阿里云云栖大会如期开幕,阿里云旗下的通义千问,交上本月的最后一份答卷。
继4月正式发布通义千问大模型后,阿里云发布了通义千问2.0版本——与4月相比,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上,都有在性能上取得较大提升。
开放则是本届云栖的核心主题。“过去十来年,阿里云服务了中国移动互联网的大发展。今天,随着大模型技术的迅速发展,智能化时代正在开启,阿里云要打造AI时代一朵最开放的云。”主论坛演讲中,阿里巴巴集团董事会主席蔡崇信如此表示。
阿里云也亮出了通义千问和其他模型的比较结果。在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上,通义千问2.0的得分整体超越Meta的Llama-2-70B。相比OpenAI的Chat-3.5,是九胜一负;相比GPT-4则是四胜六负,与GPT-4的差距进一步缩小。
来源:阿里云
不过,和竞品拼测评分数,只能说是大模型比拼的基础。本届云栖的重点更多放在产品化、各类能力开放上。比如,通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。并且,通义千问2.0在指令遵循、工具使用、精细化创作等方面作了技术优化,这些能力更好地被下游应用场景集成。
来源:阿里云
发布会的重点,显然放在了通义系列的“模型团”上。CTO周靖人花费了大量时间介绍通义模型家族里的八大行业模型,包括:
并且,通义千问还正式发布了APP,在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。另外,开发者可以通过网页嵌入、API/SDK调用等方式,将上述的模型能力集成到自己的大模型应用和服务中。
国内大模型领域已经从通用大模型层,逐渐转向应用层。要扩大开放,也是为了吸引更多的开发者和客户。因此,理清边界很重要。
尽管阿里云这次发布了八大产品模型,但周靖人强调,阿里云此举并非为了直接To C提供服务,而是To B。做行业模型,更多是像个面向客户的Demo,让客户先了解到大模型能做什么。
截至10月,阿里云已与60多个行业头部伙伴进行深度合作,通义千问已经在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。
“要做开放的云,我们说到做到。如果有的开发者,有能力做自己的底层通用模型,我们也会提供应用模型的接口和开发平台,让开发者来做应用开发。”周靖人对36氪表示。
在早上的主论坛上,童语故事创始人兼CEO张华,就向开发者分享了一位父亲用大模型创业的故事。7个人的团队,在阿里云上创业,不到三个月,“童语故事”的MAU(月活用户)就到了几十万,平均每个月IT成本才1万元左右。“有了大模型、云计算这些成熟的技术,才能让我们实现低成本高效创业。”张华说。
从产品到生态,阿里云已经付出不少切实的努力。去年的云栖大会上,阿里云发布了AI开源社区“魔搭”。一年后,魔搭现在已有280万开发者、2300多个优质模型,模型下载量超过1亿。
比起从模型到应用都做,阿里云更希望达到的未来是,让开发者、中小企业借助通义千问的基础模型能力,借助开源社区的各类资源,快速地开发自己的模型。