文章来源:钛媒体AGI
作者|林志佳
图片来源:由无界AI生成
3月23日-24日,2024全球开发者先锋大会(GDC)在上海徐汇召开。
本届GDC大会期间,阿里云魔搭社区公布“ModelScope-Sora开源计划”,将为类Sora模型开发提供一站式工具链,涵盖数据处理工具、多模态数据集、类Sora基础模型、训练推理工具等。同时,魔搭还发布业界首个开源的多模态数据处理系统Data-Juicer,包含100多种高效算子,并提升视频数据处理效率和质量。
(图片来源:钛媒体App编辑拍摄)
阿里云方面透露,作为国内规模最大、最活跃的AI开源模型社区,目前,阿里云魔搭已涵盖超过3400款优质模型及上千数据集,为超过400万开发者提供模型及免费算力服务。
事实上,随着ChatGPT风靡全球,最近半年多,阿里在大模型领域动作频频:做投资、做开源大模型和社区、卖 AI 云服务等。
去年4月11日,阿里云推出超大规模的语言模型“通义千问”。10月,阿里云发布千亿级参数大模型通义千问2.0,同时还公布通义8大行业模型和一站式大模型应用开发平台阿里云百炼,并透露阿里云上有超过30款云产品已接入 AI 大模型能力。
阿里集团董事长蔡崇信曾表示,目前,中国有一半大模型企业跑在阿里云上,并为中国约80%的科技公司提供服务。
如今,阿里不仅自家正开发通义千问等大模型产品,而且还不断投资布局,一举拿下国内多家大模型领域头部独角兽企业,包括智谱 AI、百川智能、月之暗面、零一万物和Minimax等。
阿里云创业者计划负责人李婷此前在一场演讲中表示,截至目前,阿里云创业者计划与上百家机构合作,包括投资机构、孵化器、加速器、初创投资机构等,如蓝驰创投、源码资本、真格基金等,目前已有超过 1 万家 AI 初创企业申请获得云抵扣金补贴以及技术支持。
一面自研大模型、一面做投资和生态布局。在新一轮 AI 浪潮下,阿里云以及阿里大模型希望怎样战略布局其大模型生态?GDC大会期间,钛媒体App与阿里云内部人士Edward进行了简单的独家交流。
Edward对钛媒体App表示,阿里云是做基础设施的。阿里云的愿景是成为全球领先的云计算服务提供商,为客户提供高效、安全、可靠的云计算服务。而无论是中国 AI 产业发展,还是国际化、云计算产业,规模效应做的越来越大,我们(阿里云)的基础设施才能卖得更好。
“中国能做云计算的就这几家,阿里、华为、百度等拥有大模型,而其他做大模型都是背靠一家比较大的大厂,那么未来,(拥有大模型的云企业)肯定只剩我们一家,所以我们有义务去把通用大模型做起来。”Edward表示。
Edward坦言,阿里通义大模型一大优势是开源、开放,企业使用成本低。而且阿里云提供公有云算力,一家大模型企业需要大量算力的话,现在买卡很贵而且买不到,但你可以通过阿里云随租随用,无论是训练还是未来推理,阿里云都能提供低时延性、灵活性算力——弹性计算(Elastic calculation)。
谈及端侧大模型是否会比云端大模型更具市场发展前景,Edward指出,端侧模型市场肯定是有的,但对于未来大模型算力来说,云端大模型总体还是重要趋势,因此未来云计算算力一定是在往上涨的过程中。
而谈到“低端算力过剩、高端算力稀缺”这一话题时,Edward提及,为了解决算力市场不均衡的问题,阿里云研发了“一云多芯”技术,与英特尔、AMD的“异构计算”类似,支持多种卡并用,以解决算力不充分的问题。
阿里集团CEO吴泳铭曾表示,通用 AI 正在从技术梦想一步步走向现实,大模型技术落地应用呈现星火燎原之势,全球已经出现了一批AI native(智能原生)的独角兽企业,将给人类的工作、生活带来翻天覆地的变化,同时也会深刻影响科学研究与产业发展的进程。我们正处于一场新革命的风口浪尖。面向未来,“云+AI”是支撑创新发展的底座。阿里将继续围绕国家科技战略,加大技术、人才、资金等投入,持续增强 AI 的基础服务体系能力,不断拓展开源开放边界。
语鹦企服 2024-12-19