2月9日,《中国电子报》记者从阿里巴巴确认,阿里巴巴达摩院正在研发类似ChatGPT的AI产品,目前已处于内测阶段。日前,该内测版本已被提前曝光,不仅能通过文字与人对话,甚至还具备“AI绘画”等多模态任务能力。
据悉,阿里版ChatGPT,正是基于其在2022年9月发布的“通义”大模型系列融合升级而来。达摩院副院长周靖人表示,“通义”打造了业界首个AI统一底座,实现模态表示、任务表示、模型结构的统一,为AI从感知智能迈向知识驱动的认知智能提供了基础设施。
近年来,大模型表现出前所未有的理解与创造能力,且打破了传统AI只能处理单一任务的限制,让人类离通用人工智能的目标近了一步。但大模型在实现全模态和全任务的通用性上仍存在许多技术难点,同时受算力资源限制,其训练与落地应用颇具挑战。
来源:IDC
阿里巴巴达摩院自2021年起已先后发布多个版本的多模态及语言大模型,在超大模型、低碳训练技术、平台化服务、落地应用等方面实现突破。IDC近期发布的《2022 H1中国AI云服务市场研究报告》显示,阿里AI在ChatGPT相关的语音语义领域市场份额达到31.98%,其中阿里对话式AI、语言AI、语音AI市占均为第一。Gartner《云AI开发者服务关键能力报告》显示,阿里语言技术获得四个项目的最高分,总分排名全球第二,创下中国企业在该领域最好成绩。
为了进一步解决大模型通用性及易用性难题,让大模型更加“融会贯通”。“通义”统一底座中M6-OFA模型,作为单一模型,在不引入任何新增结构的情况下,可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务,且效果达到国际领先水平。
截至目前,通过部署超大模型及轻量化版本,阿里巴巴通义大模型系列已在超过200个场景中提供服务,实现了2%~10%的应用效果提升。典型使用场景包括电商跨模态搜索、AI辅助设计、开放域人机对话、法律文书学习、医疗文本理解等。
“大模型模仿了人类构建认知的过程,这是当下我们面临的重要机遇。通过融合AI在语言、语音、视觉等不同模态和领域的知识体系,我们期望多模态大模型能成为下一代人工智能算法的基石,让AI从只能使用‘单一感官’到‘五官全开’,且能调用储备丰富知识的大脑来理解世界和思考,最终实现接近人类水平的认知智能。”周靖人说道。
另外,在2022云栖大会上,阿里巴巴达摩院还联手CCF开源发展委员会共同推出AI模型社区“魔搭”ModelScope,旨在降低AI的应用门槛。达摩院率先向魔搭社区贡献300多个经过验证的优质AI模型,超过1/3为中文模型,全面开源开放,并且把模型变为直接可用的服务。
中国计算机学会副理事长、澜舟科技创始人兼CEO周明博士表示,随着预训练模型的兴起,魔搭这样的模型社区有望成为AI时代的基础设施,能将AI模型以较低门槛提供给广大开发者,让AI惠及全社会。
晟云磐盾信息技术有限公司总裁郝峻晟在接受《中国电子报》记者采访时坦言:“中国云厂商要想做出一款ChatGPT的产品还有很长一段路要走。一方面AI大模型训练需要投入大量时间与成本,我们已经落后了;另一方面,中文语料数量远远小于英文语料的数量,而中文的模糊性也远比其他语言要高,这会造成算法在计算过程中的一些问题。”
“国内云厂商实际也在不断寻求应用场景、挖掘潜在客户群体,但如果没有真正的算力需求性技术生态和产业集群,无法实现大规模的业务增长。ChatGPT虽然眼下非常火爆,但是行业落地和规模化应用之路尚在初期。”北京计算机学会数字经济专委会秘书长王娟则对记者表示。不过,她认为,软件行业的智能化新时代已经拉开大幕,发展中的泡沫和弯路在所难免,但唯有不断创新,才能解决技术发展中的瓶颈和困惑。
作者丨宋婧
编辑丨刘晶
美编丨马利亚
监制丨连晓东