在通义大模型发布一周年之际,阿里云宣布了其最新的技术进展和开源计划,展示了通义千问2.5大模型的卓越性能,并开源了具有1100亿参数的模型Qwen1.5-110B。不仅标志着阿里云在人工智能领域的领先地位,也体现了其对开源社区和企业级应用的坚定支持。
通义千问2.5的发布与性能提升
通义千问2.5是阿里云在自然语言处理领域的最新力作,其性能在多个方面实现了显著提升。与前一版本相比,2.5版本在理解能力、逻辑推理、指令遵循和代码能力上分别提升了9%、16%、19%和10%。特别是在中文语境下,通义千问2.5在文本理解、文本生成、知识问答及生活建议等多个方面超越了GPT-4,在OpenCompass基准测试中得到了体现,通义千问2.5的得分与GPT-4Turbo持平,这是国产大模型首次在该基准上取得如此成绩。
开源模型Qwen1.5-110B的卓越表现
阿里云发布的1100亿参数开源模型Qwen1.5-110B在多个基准测评中超越了Meta的Llama-3-70B模型,并在HuggingFace的OpenLLMLeaderboard排行榜上位列榜首,证明了通义开源系列的强大竞争力。Qwen1.5-110B的开源,使得海内外的中小企业和开发者能够通过下载模型,加速技术追赶和行业落地,目前已有超过700万的累计下载量。
多模态与专有能力模型的领先
通义千问的多模态模型和专有能力模型同样在业界中具有显著的影响力。视觉理解模型Qwen-VL-Max在多个多模态标准测试中超越了GeminiUltra和GPT-4V,并已在多家企业中得到应用。而代码大模型CodeQwen1.5-7B则在HuggingFace的BigCode模型榜单中名列前茅,成为国内用户规模第一的智能编码助手通义灵码的核心技术。
企业级应用与服务
阿里云不仅关注模型的技术进步,还致力于将通义大模型应用于企业级服务。百炼平台的2.0升级,提供了更加易用和开放的服务,支持企业级检索增强服务(RAG),并兼容了LlamaIndex等开源框架。此外,通义灵码推出企业版,旨在满足企业用户的定制化需求,提升研发效率。通义灵码企业版支持多种编程语言,并提供代码生成、阅读、Bug检测和优化等服务。
通义大模型的广泛应用
通义大模型已经通过阿里云服务于超过9万家企业,并通过钉钉服务于超过220万家企业。其应用领域广泛,包括PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏和文旅等。此外,小米旗下的“小爱同学”、微博、众安保险和完美世界游戏等知名企业也宣布与通义大模型合作,将大模型技术应用于各自的业务领域。
结语
阿里云通过通义千问2.5的发布和1100亿参数模型的开源,展示了其在人工智能领域的技术实力和对开源社区的承诺。通义大模型的持续进步和广泛应用,不仅推动了技术的发展,也为各行各业带来了创新的解决方案。随着百炼平台的升级和通义灵码企业版的推出,阿里云正致力于构建一个更加开放、易用、高效的AI生态,助力企业把握大模型时代的机遇。