阿里云发布通义千问2.0,八大行业模型组团上线
【大河财立方 记者 陈薇 文图】继今年4月通义千问1.0发布之后,10月31日“2023杭州·云栖大会”上,阿里云首席技术官周靖人发布了通义千问2.0,他表示,2.0版本不管是在产品的体验,还是背后的模型,都有大幅度的改观和提升。为促进大模型行业应用,阿里云同时发布一系列行业模型,涉及娱乐、教育、企业等场景,涵盖包括金融、医疗、传媒、法律等多个领域。
多领域能力提升,通义千问2.0发布
据周靖人介绍,过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。
中英文理解能力是大语言模型的基本功。英语任务方面,通义千问2.0能更好地理解和处理复杂的语言结构和概念;中文任务方面,由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。
在数学推理、代码理解等领域,通义千问2.0进步明显,这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。同时,通义千问2.0在指令遵循、工具使用、精细化创作等方面做了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。
在MMLU、C-Eval等10个权威测评中,千亿级参数大模型通义千问2.0,得分整体超越Meta的Llama-2-70B,相比OpenAI的Chat-3.5是九胜一负,相比GPT-4则是四胜六负,与GPT-4的差距进一步缩小。
当天,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。
行业大模型涌现,落地应用加快
通义大模型是基于阿里云人工智能平台PAI训练而成。除了通义大模型,中国一半大模型公司跑在阿里云上,百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等大批头部企业及机构均在阿里云上训练大模型。
2023年4月,搜狗公司原CEO王小川官宣创办AI大模型公司“百川智能”,此后百川短短数月便跻身科技独角兽行列。仅半年时间,百川先后发布7款基础大模型,研发速度远超行业水平,且开源模型表现优异。王小川在接受大河财立方记者采访时表示,百川智能和阿里云进行了深入合作,在双方的共同努力下,百川很好地完成了千卡大模型训练任务,有效降低了模型推理成本,提升了模型部署效率。
“妙鸭相机”今年7月以9块9价格和高质量“写真”照火爆出圈,而相片生成需要庞大的GPU算力进行计算,上线不到一个月,算力需求暴涨数百倍。“妙鸭相机”在阿里云上进行紧急扩容,应对暴涨数百倍的算力需求,此后因用户暴增导致的排队情况也有所缓解,排队时长大幅减少,用户体验得到改善。
朗新科技、央视网、亚信科技等早期用户已在阿里云百炼平台上成功开发了自己的专属模型和应用,为各自领域带来了重要创新。
为便利大模型行业应用,基于通义大模型训练的8大行业模型也亮相云栖大会,包括通义灵码-智能编码助手、通义智文-AI阅读助手、通义听悟-工作学习AI助手、通义星尘-个性化角色创作平台、通义点金-智能投研助手、通义晓蜜-智能客服、通义仁心-个人专属健康助手、通义法睿-AI法律顾问。
8大行业模型面向当下应用较多的垂直场景,使用领域数据进行专门训练。用户可以在官网直接体验模型功能,开发者可以通过网页嵌入、API/SDK调用等方式,将模型能力集成到自己的大模型应用和服务中。
责编:任浩鹏 | 审校:李金雨 | 审核:李震 | 监审:万军伟