金融界2024年12月26日消息,国家知识产权局信息显示,平安科技(深圳)有限公司申请一项名为“语音生成方法、装置、电子设备及存储介质”的专利,公开号 CN 119181346 A,申请日期为 2024 年 9 月。
专利摘要显示,本申请实施例提供了一种语音生成方法、装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:获取经口语化处理后的待处理文本;将所述待处理文本输入至训练后的分词器,输出所述待处理文本的文本离散表征;将所述文本离散表征输入至训练后的多任务模型,输出与所述文本离散表征具有映射关系的语音离散表征;将所述语音离散表征输入至训练后的解码器,输出频谱信息;通过训练后的声码器将所述频谱信息转化为语音音频。以此,通过包含更多关于语音的深层次信息的语音离散表征作为后续生成语音的基础,以提高生成的语音的自然度。
来源:金融界