作者 | 刘宝丹
编辑 |周智宇
AI大模型应用正处于爆发的前夕。面对从基础大模型到行业应用之间的鸿沟,阿里云决定用力推一把。
5月9日,阿里云对外正式发布了通义千问2.5。根据权威基准OpenCompass的测评结果,通义千问2.5得分追平GPT-4 Turbo,打破了国产大模型的新纪录。
此外,阿里云还宣布开源1100亿参数模型Qwen1.5-110B。据了解,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型。在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首。
在大模型能力上秀肌肉的阿里云,希望能够借此进一步推动大模型落地。
阿里云首席技术官周靖人表示,“模型的潜力还没有真正被挖掘出来,在这个时间点,我们希望把最先进的技术开源出来,让大家做并行探索。”
目前,阿里云吸引不少开发者加入其中。截至目前,魔搭社区已经有4500个高质量的模型,包含各种各样的开源模型,开发者的用户数已经超过500万,魔搭成为中国最大的AI模型社区。
如果说开源是为了推动国内AI生态的发展,避免重复建设,让部分有能力的企业直接应用。那么,百炼平台的升级则是为了让大模型和企业场景做更好地结合。
在会上,百炼平台时隔8个月迎来2.0全面升级,范围涵盖模型开发、应用开发和算力底座,不仅引入更多模型,还率先兼容LlamaIndex等开源框架,企业可自由替换能力组件来适配自身系统。
周靖人介绍,当下企业应用大模型存在三种范式,一是对大模型开箱即用,二是对大模型进行微调和持续训练,三是基于模型开发应用,其中最典型的需求是RAG,以企业数据对大模型进行知识增强。百炼打造了模型中心和应用中心,以满足上述需求。
这是一个重要转变,意味着阿里云当下的重心已经从模型能力研发向应用端转移。周靖人表示,今年整个应用会逐渐爆发,有越来越多成功的案例,他相信在这方面会有进一步的突破。
AI技术带动云计算增量需求,这是人工智能时代的确定性趋势,也是阿里云坚定实施“AI驱动”战略的核心要义。阿里云认为,未来绝大部分AI计算将主要在云上运行。
为此,两个多月前,阿里云进行了史上最大力度的降价,涉及产品超过100款,平均降价幅度超过20%。阿里云资深副总裁刘伟光认为,云计算是一个具备网络效应和规模效应的商业模式,阿里云为数百万客户提供一个可复用的全球云计算网络和资源池,用的客户越多,成本越低。
如今,阿里云加快推进大模型在企业端的应用和创新,很大程度上,这也暗含了阿里云对业绩增长的考虑。
2月7日,阿里发布三季度财报,阿里云实现营收280.66亿元,增速为3%。业绩增长乏力的同时,阿里云面临的是高企的大模型训练成本。虽然有阿里集团的坚定支持,但阿里云的商业模式终究需要在AI时代自我验证。
国内大模型的应用和创新才刚刚开始,作为全球唯一一家做基础模型研发并开源的云计算厂商,阿里云无疑是AI风口上的企业,至于能否将AI机遇转化成业绩潜力,阿里云还有很长的路要走。
以下为沟通会实录(经编辑):
问:阿里云当时决策开源的时候这个过程怎么样?作为云厂商,阿里云自研一个模型本身的意义或者想达到的目的是什么?
周靖人:开源对整个全球技术领域的贡献是毋庸置疑的。阿里云是全球唯一一家积极做AI模型同时也敢于全方位开源的云计算的厂商,最终目的还是希望能够把AI技术、能力各个方面能够赋能到企业和开发者。
模型带来的一些潜力还没有真正被挖掘出来,很多开发者或企业的实际业务需求还能有一个翻天覆地的变化,在这个时间点,我们希望能够以一个开放的心态能够把最先进的技术开源出来,让大家做并行的探索。
在AI产品上也一样,我们会把技术进展以开源方式展现给大家,一方面能力很强,另一方面也提供给大家多种选择。我们希望通过开源的体系跟企业一起来探索,不仅仅是模型能力提升,更重要的是能够把模型的前景和潜力深入地挖掘出来。
问:2024年基于MaaS直接开发的很多原生应用都在爆发,未来SaaS软件和这种AI原生应用的关系是怎样的?
周靖人:今天各行各业都会因为AI升级而重新定义自己,重新去发展自己,这个过程里,有可能诞生一些新的应用。技术发展会催生一些新的业务场景,过去不能完全覆盖或者支持的场景,在技术迭代过程中又会变成可能,这是我们人类技术发展的一个必然的趋势。
问:过去SaaS是长在PaaS平台上,未来MaaS跟PaaS之间这种关系会是怎样的,PaaS的重要性变得越来越薄吗?
周靖人:没有,MaaS本身就是长在PaaS上面,今天讲模型的训练、开发、推理都是依赖于阿里云的PaaS层。我们认为,在AI时代从IaaS到PaaS到MaaS,所谓底层、中间、上层定义云计算新的架构,这三层是相互依赖相互促进的作用。
问:从通义千问发布以来,产业落地的趋势是什么?
周靖人:模型一周年,几个领域越来越清晰。首先,模型本身的能力在快速迭代,从单一语言模型到多模态,整个技术的体系发展是在一个快速上升的渠道。
第二,技术的发展要有好的生态,只有生态的发展才有利于今天整体能够拿到更多的反馈,有更好业务的创新,激发更多模型的应用。
第三,落地的趋势也是非常重要的一环。百炼平台背后支持的是各种各样的模型,我们希望,有这样一个平台,能够真正把模型的能力和业务场景的需求建立一个很好的纽带,只有这样才能帮助大模型在各行各业落地。
问:阿里云的差异化和特点是什么?现在落地非常火,接下来针对落地,你的重点的工作是什么?
周靖人:大模型最后比拼的就是能力,差异就是能力。今天做大模型的公司有这么多家,说的是同样的故事,最后就是看技术能力和产品能力,怎么能够落地的能力。
第二个问题,我觉得至少在过去一年里面,前期可能有很多期望,但是落地过程中不是那么顺利,它涉及基础模型本身的能力,还有各种各样的规范、数据等,这必然需要有一个平台,这是为什么花了那么多篇幅讲百炼。
问:通义要用大模型把整个阿里的产品重新做一遍,内部重做一遍的进度是什么,内部使用百炼的场景以及程度是什么?
周靖人:应该说阿里体系比较庞大,AI能力在各种场景里面应该说是快速地展现出来,比如说钉钉,钉钉背后的所有AI能力都是通义提供的。
问:这是一个产品一个产品改造的逻辑,还是先搭一个底层产品平台,然后再在产品层面体现?
周靖人:和对外提供的产品一样,阿里云提供的是基础模型能力,淘系、钉钉、夸克搜索等都有自己业务的场景,会结合场景再结合模型的能力进行业务的创新和开发,这不仅仅是AI能力,还涉及业务创新、产品创新的方方面面。
问:阿里云在AI时代如何继续保持这个领先者的地位,核心竞争力是什么?
周靖人:在AI时代,阿里云技术体系是走在最前面的,我们要把先进的能力,结合产业应用真正赋能给大家,要应用到具体的场景里,只有这样,在AI时代阿里云仍然是No.1。
问:1月阿里云在新加坡发布了一系列AI产品,今天产品升级之后是否会涉及海外业务这块相关的迭代升级?阿里云在海外的布局规划是怎样的?
周靖人:相关的模型能力,包括百炼,会逐渐服务到海外市场,因为本身阿里云就是一个面向国际的云计算厂商。
问:阿里云对于客户、开发者带来了积极意义,这些有没有给阿里云自身带来一些正向的影响,比如说对云的需求量有没有提升?
周靖人:我们整体也不完全是功利的心态在做,不然的话你的出发点就是不太纯正。我们认为,今天整个生态的发展非常重要,这是为什么不仅仅是讲到通义,也讲到魔搭社群,让更多的人参与进来,只有这样把这个蛋糕做得更大,才能带来整个行业发展。
问:通义如何去帮助中小企业和成长型企业做业务?
周靖人:百炼就是我们朝着这个方向走出的最重要的第一步。让中小企业在各种场景里面都能使用模型,是不容易的,直接调用,微调及模型的二次优化,深度的指令PROM优化,稳定的支持体系等,这些都是我们要帮助中小企业去提供的能力。
*免责声明:文章内容仅供参考,不构成投资建议
*风险提示:股市有风险,入市需谨慎