金融界2024年11月4日消息,国家知识产权局信息显示,平安科技(深圳)有限公司申请一项名为“跨信道声纹识别模型的训练方法、装置、设备及存储介质”的专利,公开号CN 118887961 A,申请日期为2024年8月。
专利摘要显示,本发明涉及一种跨信道声纹识别模型的训练方法,通过获取语音数据对,确定预训练的声纹识别模型,预训练的声纹识别模型包含特征提取器,特征提取器用于提取语音数据对的语音特征。预训练的声纹识别模型还包含特征解耦层,特征解耦层用于提取语音特征中的声纹特征。预训练的声纹识别模型还包含说话人预测器与信道预测器,说话人预测器与信道预测器用于确定说话人标签和信道标签,利用语音数据对与随机梯度下降和梯度反转方法训练特征解耦层、说话人预测器与信道预测器,得到目标声纹识别模型。本发明通过引入梯度反转技术,有效去除音频数据中的信道信息,从而增强模型在不同信道下的泛化能力和识别准确性。
来源:金融界