在本届世界移动通信大会(MWC24)上,高通带来了一系列的最新AI技术创新成果。
这两年AI已经成为全行业重点关注的体验,尤其是最近这段时间,终端侧AI在手机、PC等设备上的部署和应用已经成为了大趋势。高通认为,终端侧AI已经到来,为了能够给开发者提供更多的支持,赋能其打造全新的、令人期待的应用。高通在本届MWC上宣布推出全新的高通AI Hub。
高通AI Hub是为开发者提供全面优化的AI模型库,包括传统AI模型和生成式AI模型,能够支持在骁龙和高通平台上进行部署,开发者能够通过高通AI Hub更便利地基于骁龙或高通平台打造AI应用。
有了高通AI Hub的帮助,开发者打造AI应用将会变得简单和高效。开发者可以选择应用所需的模型(例如Baichuan-7B),以及其开发应用所使用的框架(例如Pytorch、Tensorflow)。然后开发者只需要确认目标平台,例如一款特定型号的手机、或者一款特定型号的高通平台。确定以上信息后,高通AI Hub就可以为开发者提供面向其指定应用、指定平台进行优化的模型。开发者只需要几行代码就可以获取模型,并将模型集成进应用程序。
据了解,高通AI Hub将支持超过75个AI模型,包括传统AI模型和生成式AI模型。通过对这些模型进行优化,开发者运行AI推理的速度将提升高达4倍。同时优化后的模型占用的内存带宽和存储空间也将大大减少,从而实现更高的能效和更持久的电池续航。
与此同时,在本届MWC展会上,高通还带来了一系列先进的AI技术的应用。
高通展示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型(LMM)。该LMM模型支持超过70亿参数,不仅能够接受文本输入,还可以接受图像、音频等其它输入数据类型,并能够基于输入的内容进行多轮对话。
该模型能够实现丰富而强大的应用体验。比如你可以拍摄一张食物照片,然后询问AI:这些食材都是什么?根据这些食材能够做什么菜?每道菜的热量是多少?AI助手就能够基于视觉内容提供丰富的信息。
特别值得一提的是,该模型所有的AI功能完全在终端侧运行,能够以非常及时的响应速度生成token,并且更好地保护隐私。
在搭载全新骁龙X Elite平台的Windows PC上,高通带来另一个多模态AI的演示。这是全球首个在Windows PC上运行的音频推理多模态大模型,它能理解鸟鸣、音乐或家中的不同声音,并且能够基于这些信息进行对话,为用户提供帮助。
该多模态大语言模型能够理解用户输入的音乐类型和风格,为用户提供音乐的历史以及相似的音乐推荐,或通过对话的方式为用户调节周围的音乐。同样,以上模型经过优化,能够实现出色的性能和能效,并完全在终端侧运行,以充分发挥骁龙X Elite的强大能力,增强隐私性、可靠性、个性化以及成本优势。
高通还展示了首个在Android手机上运行的LoRA模型。LoRA能够在不改变底层模型的前提之下,调整或定制模型的生成内容。通过使用很小的适配器(大小仅为模型的2%,便于下载),就能够个性化定制整个生成式AI模型的行为。
在演示中,模型能够根据不同个人或艺术偏好创建高质量自定义图像。LoRA是面向终端侧生成式AI的关键技术,它能够提升效率,可扩展性以及定制化能力。这一技术不仅能够运用于图像生成,也可以应用于大语言模型等多种生成式AI模型,是实现个性化生成式AI的高效方式。
高通一直致力于将智能计算扩展至边缘侧几乎所有类型的终端,包括PC、汽车、智能手机、Wi-Fi设备、网络基础设施等,并为其带来无与伦比的连接、领先的边缘AI以及高性能低功耗处理能力。凭借这些特性,OEM厂商和开发者能够更好地打造具备智能计算能力的终端,为我们带来更具生产力、更加便捷、更有趣的生活,并推动社会进步与发展。