随着人工智能、大数据等技术的不断发展,AI已经不再是只有专业人士才能接触到的技术,越来越多领域积极探索并应用AI技术,让每一位普通人都可以享受AI带来的便利与智能。作为国内知名音频平台,喜马拉雅持续通过技术创新提升用户体验,以技术赋能喜马拉雅上市之路。
声音,是唯一一种可以摆脱眼睛的媒介形式,这个领域的空间很大。在洗澡、出行、做家务的同时听一段音乐、名著,成为移动用户在快节奏生活中很好的排压方式。随着音频平台盈利模式逐渐清晰,“耳朵经济”也迎来了快速发展。根据《中国网络视听发展研究报告》数据,喜马拉雅以73.5%的市场占有率稳居网络音频平台的榜首,成为业内竞争中不可忽视的领军品牌。
在技术的引领下,AI-Generated Content(AIGC)正成为音频内容创作的引擎。喜马拉雅一直致力于AIGC的研发,在AIGC的多模态、软硬件结合、全景声技术上走在前沿。今年初,喜马拉雅在ASRU 2023年M2MeT2.0挑战赛中以出色的说话人和语音识别技术(ASR)获得第一,为AIGC技术的领先地位赢得了瞩目。喜马拉雅的自动语音识别(ASR)技术目前已广泛应用于喜马拉雅App的AI文稿功能,可对平台中无文稿的声音内容进行语音转写,输出相应的文字,使听众更好地理解声音内容。
除了ASR技术,喜马拉雅的TTS(语音合成)技术也位居行业前列,广泛应用于评书、新闻、小说等多种内容的制作中。此前,喜马拉雅珠峰实验室团队通过AIGC方式创作了超过3.7万部有声书专辑,AIGC作品每日播放时长已超过250万小时。
另外,喜马拉雅在AIGC方面的持续探索,还为亲子关系构建了桥梁。利用AI技术,家长的声音可以嵌入喜马拉雅儿童庞大的故事库,内容包括中外名著、侦探故事、诗词国学、童话寓言、神话传说等,总计超过3万个故事。用户只需简单录制5段文本,系统将进行AI模型训练定制声音,成功后即可在“爸妈讲故事”页面或支持AI转音的专辑中播放自己的声音,为亲子共读提供更个性化的体验,拉近亲子之间的联系。
当前,在线音频迎来快速发展期,喜马拉雅积极把握机遇,不断通过科技赋能产品,为创作者提供了便捷的操作工具,为消费者带来了更好的使用体验。未来,平台将持续进行创新,为喜马拉雅IPO添动能。