杨艾莉等：苹果MR头显来了，带来哪些行业机会？

作者：中新经纬发布时间：2023-06-06

作者杨艾莉中信建投传媒互联网行业首席分析师

刘双锋中信建投电子行业首席分析师

王天乐中信建投电子行业分析师

2023年，苹果的全球开发者大会备受瞩目。苹果正式发布了混合现实(MR)头戴式设备“Apple Vision Pro”，预计将于2024年初开售，售价为3499美元(约合人民币2.5万元)。如果说此前苹果Mac、iPhone等产品的推出都是“划时代”的产品，引领了整个行业的蜕变，此次苹果的MR头显能否再次颠覆行业？又将带来哪些行业机会？

第一代头显自2015年左右开始研发，配备了性能可以媲美最新款Mac的先进处理器，而且搭载了超高分辨率屏幕。目前设备进入量产准备阶段。第二代Apple AR/MR(增强现实/混合现实)预计2025年上半年出货，零组件供应商预计2024年下半年供货。苹果公司首席执行官库克表示，AR是一个像智能手机一样伟大的想法，苹果希望AR眼镜能在10年后取代iPhone。那么，可以预计它未来的总销量将会达到数十亿台。

苹果自从2014年开始，即为AR/VR(HMD头戴式显示设备)积累了大量专利。其中包括显示类、扫描类、手部识别、眼球追踪、音频、导航、监测、AI算法、操控、识别等多方面技术。

生成式AI的快速发展将为XR(扩展现实)设备销量的提升带来契机。一方面，大语言模型及SAM(图像分割)等模型带来的理解能力提升将为XR设备的语音交互、物体识别等带来更多的可能，带来更具有沉浸式的交互体验；另一方面，生成式AI降低了3D资产制作的成本和门槛，为VR游戏、VR视频、AR应用程序等专业内容制作降本增效，通过文字或语音即可建立3D模型甚至程序将极大丰富UGC(用户原创内容)。

Meta发布图像分割模型，有望接入XR设备识别物品。未来，SAM有望接入XR设备，例如可用于通过AR眼镜识别日常物品，用户仅需要使用目光注视物体，SAM对用户看到的画面进行分割，配合AR眼镜应用，为用户展示所注视物体的提醒和说明。大语言模型极大提升文字理解能力，为XR设备实现深层次语言交互奠定基础。一方面，大语言模型能够理解更复杂的自然语言，完成更复杂的自然语言处理任务，进而能够听懂用户以语音形式给出的复杂指令并做出响应，使得XR设备除肢体、眼睛交互外增加一种深层次的语音交互方式，使得用户与设备之间的交互更加综合。另一方面，大语言模型可为虚拟助手、聊天机器人或其他支持语音的交互式XR应用程序提供更逼真、更自然的对话，这有助于通过提供更自然和直观的交流方式来改善整体交互体验。

生成解决方案：帮助游戏开发者以更低成本创造风格多样、贴近现实的虚拟城市，提升3D虚拟场景的生产效率。这样，一座大规模城市的3D构建，过去往往需要多名美术师以年为单位的时间才能完成，而结合AI只需要数周。

VR游戏：大幅降低VR游戏开发成本，促进更多开发者投入。AI驱动虚拟主播，降低VR内容制作成本。OpenAI的大模型技术支持对玩家对话内容、游戏情节、关键物品和行为等进行解析，结合微软TTS技术进行语音合成和声纹模仿，创造出与人类主播非常相似的虚拟主播。

VR社交/虚拟人：降低普通用户3D内容创作门槛，极大丰富UGC。AI驱动的3D资产生产力提升，达数倍甚至数十倍。若以腾讯AI Lab提出的3D虚拟场景自动生成解决方案测算，其将构建大规模3D城市时间由数年减少到数周，带来的是生产力数十倍的提升。