在当今技术不断演进的时代,音频行业正在迎来一场前所未有的变革。作为音频领域的领军者之一,喜马拉雅通过持续的技术创新和全景声技术提升用户体验,成为内容创新的引领者。
AIGC——音频内容的技术革新之路
随着音质传输、智能交互和终端场景的不断升级,在线音频内容的消费时长正迎来加速增长。根据《中国网络视听发展研究报告》数据,喜马拉雅以73.5%的市场占有率稳居网络音频平台的榜首,成为业内竞争中不可忽视的领军品牌。喜马拉雅在内容生产方面不仅注重提升质量和效率,更通过技术创新推动PGC+PUGC+UGC模式的蓬勃发展,激发用户更便捷地参与音频创作。
(中国网络视听发展研究报告(2023)
在技术的引领下,AI-Generated Content(AIGC)正成为音频内容创作的引擎。喜马拉雅一直致力于AIGC的研发,在AIGC的多模态、软硬件结合、全景声技术上走在前沿。今年初,喜马拉雅在ASRU 2023年M2MeT2.0挑战赛中以出色的说话人和语音识别技术(ASR)获得第一,为AIGC技术的领先地位赢得了瞩目。喜马拉雅的自动语音识别(ASR)技术目前已广泛应用于喜马拉雅App的AI文稿功能,可对平台中无文稿的声音内容进行语音转写,输出相应的文字,使听众更好地理解声音内容。
同时,对于已有原始文稿的声音内容,喜马拉雅的AI文稿功能通过超长音频与文本的对齐技术,实现声音播放与文字同步高亮,让用户能够更便捷地享受边听边看的内容消费体验。除了ASR技术,喜马拉雅的TTS(语音合成)技术也位居行业前列,广泛应用于评书、新闻、小说等多种内容的制作中。通过将自主设计的韵律提取模块融入到HiTTS技术框架,喜马拉雅成功复现了单田芳的声音。这一项目成为AIGC的典范之一,单田芳的AI合成音已上线100多张专辑,总播放量超过1亿,其中不乏播放量突破百万的经典之作。
10月31日,喜马拉雅珠峰语音生成式技术亮相2023云栖大会。该技术由喜马拉雅珠峰实验室与西北工业大学aslp lab合作推出,具备快速实现语音音色和风格定制的能力。支持丰富场景下的音色实时转换,为声音注入了创造性的“变声”能力,形如给声音涂上不同的“画皮”。此前,喜马拉雅珠峰实验室团队通过AIGC方式创作了超过3.7万部有声书专辑,AIGC作品每日播放时长已超过250万小时。
此生成式技术已应用于喜马拉雅APP的“爸妈讲故事”功能。利用AI技术,家长的声音可以嵌入喜马拉雅儿童庞大的故事库,内容包括中外名著、侦探故事、诗词国学、童话寓言、神话传说等,总计超过3万个故事。用户只需简单录制5段文本,系统将进行AI模型训练定制声音,成功后即可在“爸妈讲故事”页面或支持AI转音的专辑中播放自己的声音,为亲子共读提供更个性化的体验,拉近亲子之间的联系。
技术创新赋能商业,共筑良性网络
AI技术不仅在内容消费层面优化着体验,随着汽车保有量的持续上升,以及车载娱乐的加速丰富,“汽车数字软装”也越来越受到消费者的关注。消费者可以通过汽车上提供的声音、操控、舒适度等多种服务来获得更好的驾驶体验和娱乐享受。知名移动大数据服务商极光大数据权威发布《2023车载音频行业洞察报告》显示,喜马拉雅在车载音频平台渗透率、Top车企高覆盖度、用户忠诚度和品牌认可度维度上领跑车载音频行业的综合音频类平台,成为车载音频行业第一品牌。用户忠诚度方面,81.7%的喜马拉雅车载版用户表示相比其他平台,会更愿意一直使用喜马拉雅。
喜马拉雅通过技术创新为商业赋能,在蓬勃发展的车载音频行业中,技术创新成为平台竞争的亮点。截至2023年6月,喜马拉雅已与80多家汽车品牌合作,为超过1亿车主用户提供服务。喜马拉雅不断改进音频质量、引入智能推荐、支持多端打通、实现语音控制等手段,致力于为用户提供更全面、个性化的音频体验。
特斯拉在最新的2023.26.9版本的OTA升级中,车主可以用语音指令来播放喜马拉雅的音频内容。基于音频用户的使用偏好,喜马拉雅车载版提供智能化、个性化内容推荐,根据特斯拉用户的需求和喜好,提供更符合个性化和定制化的音频内容。比如,在听完一本有声小说后,可以推荐相似或相关的作品;在听完一档脱口秀后,可以推荐同类或同主题的节目。喜马拉雅与特斯拉强强联手,让车主在出行过程中可以享受更流畅、更个性、更高质、更智能的音频服务。
(特斯拉2023.26.9版升级)
作为国内首家探索有声书全景声制作的互联网平台,喜马拉雅车载全景声技术为用户提供卓越的音频体验,与WANOS合作推出的全景声有声剧作品已引入理想汽车的L系列车型,配合理想汽车自研的7.3.4音响系统,为用户带来沉浸式的音效体验。喜马拉雅与杜比实验室联手打造杜比全景声专区也已上线蔚来汽车,首发上线内容涵盖科幻、悬疑、儿童等多品类精品有声书。据悉,经典科幻IP《流浪地球2》《索拉里斯星》《沙丘序曲》《爱,死亡和机器人》,悬疑IP《李昌钰·罪案剧》《一生悬命》等,以及儿童类优质IP《纳尼亚传奇》和喜马拉雅原创IP《李哪吒上学记》登陆蔚来汽车。这些有声内容的杜比全景声版本由喜马拉雅珠峰实验室制作完成。
(喜马拉雅杜比全景声有声剧登陆蔚来汽车)
车载音频平台突破单一音娱功能服务,通过整合计算、储存、运营等技术,引入用户内容共创以及车企内容、运营、技术共建,打造更开放融合的能力体系,赋能车企智能车联网生态建设。喜马拉雅车载端应用充分展示了“汽车数字软装”的特征,通过软件升级提升汽车功能和用户体验,与汽车行业的智能化、数字化和互联化发展趋势相一致。
在未来,喜马拉雅将继续以用户为中心,提供更多个性化和定制化的服务。通过技术创新和与车企、智能硬件等领域深度合作,通过汽车数字软装、科技赋能文化,推动行业的良性发展,共同构建了一个良性、创新的网络生态。