编辑部 发自 凹非寺
量子位 | 公众号 QbitAI
有算力就有超越Sora的可能。
70%的代码问题,现在单纯靠基座模型解决不了。
基于垂直场景的大模型应用创新,只有两年的窗口期。
ROI是衡量AIGC应用价值的第一标准。
AI给了每个人一次突破自己的机会。
……
在中国AIGC产业峰会的现场,20位大咖展开激辩。从软件应用、智能终端乃至具身智能等,AIGC正在全面席卷,「你好,新应用!」成为本届AIGC峰会主题。
来自AIGC底层基础设施、模型层、应用层的企业玩家,以及来自市场学术界的洞察者,畅谈大模型落地元年这个万亿市场的的机遇与挑战。
现场乌泱泱一片,500人的会场可以说是座无虚席(其实站也要没有席了)。
线上也有数百万网友围观并积极讨论,以及数十家行业知名媒体参与了大会的直播跟报道,全网总曝光量超千万。
为了让更多读者更全面、系统地了解本次AIGC峰会的内容,深入感知这股时代浪潮的发展,量子位联合各大模型做了万字梳理,希望能为大家提供一份有价值的行业参考。
(建议收藏再食用)
本次梳理主要围绕五个方面展开,分别是AIGC的模型层、应用层、基础设施层的参与者,以及行业洞察者的观点,最后是圆桌讨论的精彩观点。
AIGC模型层:微软阿里高通等玩家谈落地 微软李冕:AI应用已进入新阶段,微软助力企业级应用全球落地
微软大中华区Azure云事业部总经理李冕分享了微软Copilot与Azure AI平台如何助力企业级应用的全球落地。
李冕认为,过去12个月AI经历了数次迭代,现在AI应用已进入到一个新的阶段。企业如何打造自己的应用?怎么实现AI带来的真正价值?可以从四个方面来考虑应用落地:提升员工生产力,重塑与用户的互动关系,重塑企业内部流,加强产品和服务。
他强调了在企业打造自己的应用时微软可以为企业提供的一系列支持。
AI模型层面,李冕展开介绍了Azure平台支持的三类模型,分别是OpenAI系列模型、第三方开源模型和企业自研模型(BYOM)。同时,也讲述了小模型(SLM)在特定场景下的应用前景。
对于开发工具,李冕提到Azure提供低代码、无代码的Microsoft Copilot Studio工作台以及针对深度定制的Azure AI Studio,方便企业快速开发AI应用。
考虑到企业级应用需求,李冕还表示微软不仅在最上面的模型层为企业提供支持,还提供下面的调度层、硬件层、云数据中心等的一系列配套服务。
李冕在演讲最后重申了微软在数据隐私安全方面的承诺:
“客户的数据就是客户的数据,客户的数据不会被用来训练其它模型,所有客户数据均有企业级防护,受到全面的企业合规和安全控制的保护。”
昆仑万维方汉:天工SkyMusic音乐大模型将大大降低音乐创作的门槛和成本
昆仑万维董事长兼CEO方汉分享了“天工多模态大模型的演进落地”。大会当天,昆仑万维发布了「天工3.0」,这是中国音乐AIGC领域首个实现SOTA水平的模型。同时,他还宣布「天工3.0」基座大模型与「天工SkyMusic」音乐大模型正式开启公测。
「天工3.0」拥有4000亿参数,超越了3140亿参数的Grok-1,是全球最大的开源MoE大模型。在MMbench和MMbench-CN测试集上,「天工3.0」性能指标全面超越GPT-4V。
通过专项的Agent训练,目前大模型可以做到“能搜能写能读能聊能说能画能听能唱”,应对多种复杂的内容创作需求。例如,它可以准确识别“成都迪士尼”是个梗,并给出游玩攻略;可以自动总结文献,生成大纲、PPT和脑图;还可以通过非代码方式生成智能体。
方汉特别介绍了「天工SkyMusic」音乐大模型,得益于2000万首音乐的训练数据和独特的模型架构,「天工SkyMusic」在人声识别度、音质等方面已经超越Sora。「天工SkyMusic」支持根据音源和歌手特点生成音乐,并支持多种方言合成,大大降低了音乐创作的门槛和成本——
各行各业使用的歌曲都能通过AI生成,成本迅速从几万块钱降到几分钱。
最后,方汉分享了昆仑万维的愿景:“实现通用人工智能,让每个人更好地塑造和表达自我。”他认为,大模型的演进终将实现AGI,而AIGC能力普及则有助于打破强势文化的垄断,实现文化平权。作为一家全球化互联网企业,昆仑万维希望用AI技术为全球用户赋能。
阿里通义千问林俊旸:智能模型应融入对视觉/语音的理解
阿里通义千问开源负责人林俊旸,在现场分享了阿里通义千问大模型为“走向通用大模型”做出的努力。
林俊旸表示,自开源以来,通义千问Qwen(为了更方便英文发音,对“千问”的音译)系列模型受到了国内外开发者的广泛关注。
从去年8月开始,通义千问Qwen系列模型陆续开源上新。从7B、14B参数规模大小开始,直到开源了72B参数版本;最新动作,阿里通义千问家族还有一名“小成员”,是14B参数的MoE模型。而开发者社区的迫切需求,促使阿里快速开源了32B模型——这个模型的表现与72B参数模型表现接近,并且在某些方面相比,比MoE模型还具有优势。
林俊旸在现场强调,阿里通义千问同时十分专注打造大模型使用生态。
首先,通义千问的代码已经官方融入了抱抱脸的代码库,开发者可以更方便地使用通义千问的模型。
其次,通义千问在第三方框架支持方面有不少进展,包括ollama在内的平台,都能一键使用Qwen系列模型。
多语言、长序列、Post-training、Agent、多模态等能力相关问题,林俊旸也在现场做了分享。