本报记者 吴文婧
在3月30日举办的第十届中国网络视听大会上,当虹科技与中国移动咪咕公司联合发布跨模态AIGC(人工智能生产内容)产品,以静态照片生成三维体积视频。
与平面视频不同,体积视频可以让用户在任何位置、任何方向自由地观看,更具立体感、沉浸感和交互性。可应用于体育赛事、大型综艺6DOF(六自由度)直点播,以及出行元宇宙等场景。
解决体积视频两大痛点:采集门槛高、数据量巨大
目前,人工智能用于写作和画画已经走进现实。针对平面视频的AIGC,也在落地应用。比如通过AI进行视频拆条、视频集锦、视频超分,让版权价值最大化。三维体积视频领域,则被认为是未来AIGC发展的重要方向,其价值和潜力巨大。
据介绍,相对二维视频来说,体积视频具有门槛较高、数据量巨大等两大痛点,在很大程度上限制了体积视频的发展。按照传统方法,采集体积视频需要架设几十台、甚至上百台工业摄像机,不仅采集成本高,而且对采集环境、采集技能都有很高要求。
当虹科技与中国移动咪咕公司联合发布的跨模态AIGC产品,通过少量静态照片就能生成体积视频,支持6DOF视角自由移动,大大降低了采集门槛。
“不同模态之间相互转化,可以把现实世界中的任何物体‘搬进’元宇宙世界。”当虹科技副总裁叶建华表示,AIGC能力还可以让渲染画面更加逼真,使观看者仿佛置身真实世界。
此外,相比平面视频,体积视频数据量更大,给传输带来更大困扰。通过数个月联合研发测试,前述跨模态AIGC产品通过点云模型转换及压缩算法,为体积视频“瘦身”。最终,实现了高达800倍的视觉无损压缩,解决了体积视频的传输难题。
体积视频商用前景广阔:6DOF直点播、出行元宇宙
提到体积视频,很多人会联想到VR360°全景视频,必须借助头显设备才能观看。其实,体积视频可以实现多类型终端适配,仅凭裸眼就能与普通屏幕里的内容交互,因此具有广阔的商业应用前景。
叶建华表示,体积视频可以用于体育赛事、大型综艺6DOF直点播,带来更多沉浸感和交互性。比如,在体育赛事、大型综艺6DOF直点播场景,可以通过体积视频观看多角度的三维比赛细节,观众还可以选择自己喜好的视角,多角度地去感受现场的独特魅力。
“体积视频也将给出行元宇宙带来深刻变革。”叶建华在中国网络视听大会表示,主要是从娱乐、沉浸、安全这三个方面体现。通过体积视频技术,结合车内氛围灯、香氛、座椅、空调等硬件,能满足多场景娱乐需求,提供更沉浸式的5D观看体验。联动XR设备,体积视频技术可以创建一个虚拟影院,为用户带来沉浸式体验的同时,还可以使不同参与者在同一个场景内进行多模态互动。通过跟踪驾驶员的头部和手部动作,并仿真模拟危险驾驶场景,体积视频技术可以提供更准确的驾驶辅助。
(编辑 上官梦露)