科学技术是第一生产力,无数企业借助新兴技术提升了内容质量,实现了弯道超车。随着ChatGPT的爆火,AIGC成为目前技术领域稳稳的“C位”担当,同时也为音频带来了无限发展可能。作为国内领先的音频平台,喜马拉雅积极探索新技术,以AIGC加持业务韧性,赋予喜马拉雅上市强大动能。
在技术的引领下,AI-Generated Content(AIGC)正成为音频内容创作的引擎。喜马拉雅一直致力于AIGC的研发,在AIGC的多模态、软硬件结合、全景声技术上走在前沿。
在内容创作上,喜马拉雅利用AI技术为创作者“减负”。“工欲善其事,必先利其器”在内容生态构建中,创作工具直接决定着创作门槛的高低。而喜马拉雅通过AI技术极大地降低了内容创作的门槛,提升了创作效率,例如,专为音频创作者开发的工具“云剪辑”。这款工具甚至无需下载安装,在线即可剪辑,并集合智能音量、智能配乐、音转文剪辑、AI分段、智能检测、一键成片等强大功能于一身,是行业首款在线多轨剪辑轻应用。除此之外,针对近来众多创作者出现咳嗽并影响录音质量的情况,喜马拉雅还上线了音频降噪“黑科技”——喜马AI智能“止咳”,通过AI技术识别咳嗽声音从而实现一键降噪的效果。
在内容建设上,喜马拉雅近年来的AI语音技术落地成果也颇丰。今年初,喜马拉雅在ASRU 2023年M2MeT2.0挑战赛中以出色的说话人和语音识别技术(ASR)获得第一,为AIGC技术的领先地位赢得了瞩目。除了ASR技术,喜马拉雅的TTS(语音合成)技术也位居行业前列,广泛应用于评书、新闻、小说等多种内容的制作中。
目前,TTS生成式技术已应用于喜马拉雅APP的“爸妈讲故事”功能。利用AI技术,家长的声音可以嵌入喜马拉雅儿童庞大的故事库,内容包括中外名著、侦探故事、诗词国学、童话寓言、神话传说等,总计超过3万个故事。用户只需简单录制5段文本,系统将进行AI模型训练定制声音,成功后即可在“爸妈讲故事”页面或支持AI转音的专辑中播放自己的声音,为亲子共读提供更个性化的体验,拉近亲子之间的联系。
未来,随着人工智能和大数据技术的进一步发展和应用,喜马拉雅将继续秉持创新精神,为用户提供更加优质、个性化的音频内容和服务。同时,喜马拉雅也将继续加强自身的技术研发能力,探索更多创新性的音频技术和应用场景,为喜马拉雅IPO增添技术力量。