当前位置:首页|资讯|通义千问|ChatGPT

阿里通义千问升级2.0:八大产品模型全家桶上线,群发开发者英雄帖 | 最前线

作者:咏仪发布时间:2023-11-01

作者 | 邓咏仪

编辑 | 苏建勋

10月,可以说是国内大模型领域的一场小考,好不热闹——从腾讯、讯飞、智谱、百川,各家大模型厂商纷纷拿出通用大模型的新版本,试图一较高下。

本月最后一天,阿里云云栖大会如期开幕,阿里云旗下的通义千问,交上本月的最后一份答卷。

继4月正式发布通义千问大模型后,阿里云发布了通义千问2.0版本——与4月相比,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上,都有在性能上取得较大提升。

开放则是本届云栖的核心主题。“过去十来年,阿里云服务了中国移动互联网的大发展。今天,随着大模型技术的迅速发展,智能化时代正在开启,阿里云要打造AI时代一朵最开放的云。”主论坛演讲中,阿里巴巴集团董事会主席蔡崇信如此表示。

阿里云也亮出了通义千问和其他模型的比较结果。在MMLU、C-Eval、GSM8K、HumanEval、MATH等10个主流Benchmark测评集上,通义千问2.0的得分整体超越Meta的Llama-2-70B。相比OpenAI的Chat-3.5,是九胜一负;相比GPT-4则是四胜六负,与GPT-4的差距进一步缩小。

来源:阿里云

不过,和竞品拼测评分数,只能说是大模型比拼的基础。本届云栖的重点更多放在产品化、各类能力开放上。比如,通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。并且,通义千问2.0在指令遵循、工具使用、精细化创作等方面作了技术优化,这些能力更好地被下游应用场景集成。

来源:阿里云

发布会的重点,显然放在了通义系列的“模型团”上。CTO周靖人花费了大量时间介绍通义模型家族里的八大行业模型,包括:

  • 通义灵码-智能编码助手
  • 通义智文-AI阅读助手
  • 通义听悟-工作学习AI助手
  • 通义星尘-个性化角色创作平台
  • 通义点金-智能投研助手
  • 通义晓蜜-智能客服
  • 通义仁心-个人专属健康助手
  • 通义法睿-AI法律顾问

并且,通义千问还正式发布了APP,在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。另外,开发者可以通过网页嵌入、API/SDK调用等方式,将上述的模型能力集成到自己的大模型应用和服务中。

国内大模型领域已经从通用大模型层,逐渐转向应用层。要扩大开放,也是为了吸引更多的开发者和客户。因此,理清边界很重要。

尽管阿里云这次发布了八大产品模型,但周靖人强调,阿里云此举并非为了直接To C提供服务,而是To B。做行业模型,更多是像个面向客户的Demo,让客户先了解到大模型能做什么。

截至10月,阿里云已与60多个行业头部伙伴进行深度合作,通义千问已经在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。

“要做开放的云,我们说到做到。如果有的开发者,有能力做自己的底层通用模型,我们也会提供应用模型的接口和开发平台,让开发者来做应用开发。”周靖人对36氪表示。

在早上的主论坛上,童语故事创始人兼CEO张华,就向开发者分享了一位父亲用大模型创业的故事。7个人的团队,在阿里云上创业,不到三个月,“童语故事”的MAU(月活用户)就到了几十万,平均每个月IT成本才1万元左右。“有了大模型、云计算这些成熟的技术,才能让我们实现低成本高效创业。”张华说。

从产品到生态,阿里云已经付出不少切实的努力。去年的云栖大会上,阿里云发布了AI开源社区“魔搭”。一年后,魔搭现在已有280万开发者、2300多个优质模型,模型下载量超过1亿。

比起从模型到应用都做,阿里云更希望达到的未来是,让开发者、中小企业借助通义千问的基础模型能力,借助开源社区的各类资源,快速地开发自己的模型。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1