支持超过75款AI大模型！高通正式推出高通AI Hub

作者：机智猫发布时间：2024-03-08

在本届世界移动通信大会(MWC24)上，高通带来了一系列的最新AI技术创新成果。

这两年AI已经成为全行业重点关注的体验，尤其是最近这段时间，终端侧AI在手机、PC等设备上的部署和应用已经成为了大趋势。高通认为，终端侧AI已经到来，为了能够给开发者提供更多的支持，赋能其打造全新的、令人期待的应用。高通在本届MWC上宣布推出全新的高通AI Hub。

高通AI Hub是为开发者提供全面优化的AI模型库，包括传统AI模型和生成式AI模型，能够支持在骁龙和高通平台上进行部署，开发者能够通过高通AI Hub更便利地基于骁龙或高通平台打造AI应用。

有了高通AI Hub的帮助，开发者打造AI应用将会变得简单和高效。开发者可以选择应用所需的模型（例如Baichuan-7B），以及其开发应用所使用的框架（例如Pytorch、Tensorflow）。然后开发者只需要确认目标平台，例如一款特定型号的手机、或者一款特定型号的高通平台。确定以上信息后，高通AI Hub就可以为开发者提供面向其指定应用、指定平台进行优化的模型。开发者只需要几行代码就可以获取模型，并将模型集成进应用程序。

据了解，高通AI Hub将支持超过75个AI模型，包括传统AI模型和生成式AI模型。通过对这些模型进行优化，开发者运行AI推理的速度将提升高达4倍。同时优化后的模型占用的内存带宽和存储空间也将大大减少，从而实现更高的能效和更持久的电池续航。

与此同时，在本届MWC展会上，高通还带来了一系列先进的AI技术的应用。

高通展示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型（LMM）。该LMM模型支持超过70亿参数，不仅能够接受文本输入，还可以接受图像、音频等其它输入数据类型，并能够基于输入的内容进行多轮对话。

该模型能够实现丰富而强大的应用体验。比如你可以拍摄一张食物照片，然后询问AI：这些食材都是什么？根据这些食材能够做什么菜？每道菜的热量是多少？AI助手就能够基于视觉内容提供丰富的信息。

特别值得一提的是，该模型所有的AI功能完全在终端侧运行，能够以非常及时的响应速度生成token，并且更好地保护隐私。

在搭载全新骁龙X Elite平台的Windows PC上，高通带来另一个多模态AI的演示。这是全球首个在Windows PC上运行的音频推理多模态大模型，它能理解鸟鸣、音乐或家中的不同声音，并且能够基于这些信息进行对话，为用户提供帮助。

该多模态大语言模型能够理解用户输入的音乐类型和风格，为用户提供音乐的历史以及相似的音乐推荐，或通过对话的方式为用户调节周围的音乐。同样，以上模型经过优化，能够实现出色的性能和能效，并完全在终端侧运行，以充分发挥骁龙X Elite的强大能力，增强隐私性、可靠性、个性化以及成本优势。

高通还展示了首个在Android手机上运行的LoRA模型。LoRA能够在不改变底层模型的前提之下，调整或定制模型的生成内容。通过使用很小的适配器（大小仅为模型的2%，便于下载），就能够个性化定制整个生成式AI模型的行为。

在演示中，模型能够根据不同个人或艺术偏好创建高质量自定义图像。LoRA是面向终端侧生成式AI的关键技术，它能够提升效率，可扩展性以及定制化能力。这一技术不仅能够运用于图像生成，也可以应用于大语言模型等多种生成式AI模型，是实现个性化生成式AI的高效方式。

高通一直致力于将智能计算扩展至边缘侧几乎所有类型的终端，包括PC、汽车、智能手机、Wi-Fi设备、网络基础设施等，并为其带来无与伦比的连接、领先的边缘AI以及高性能低功耗处理能力。凭借这些特性，OEM厂商和开发者能够更好地打造具备智能计算能力的终端，为我们带来更具生产力、更加便捷、更有趣的生活，并推动社会进步与发展。