金融界2024年12月21日消息,国家知识产权局信息显示,中国电信股份有限公司技术创新中心、中国电信股份有限公司申请一项名为“一种网络模型的训练方法及装置”的专利,公开号 CN 119150951 A,申请日期为2024年8月。
专利摘要显示,本申请提供了一种网络模型的训练方法及装置,用以提高通过网络模型对数据集蒸馏的有效性。该方法包括:基于预训练过程中网络模型的损失值变化,确定待训练的初始网络模型和训练次数N;通过初始网络模型对样本数据集进行识别,确定第一样本集和第二样本集,第一样本集包括样本数据集中初始网络模型正确识别的样本,第二样本集包括样本数据集中除第一样本集之外的样本;通过第二样本集对初始网络模型进行第一阶段的训练,直至第一阶段的训练次数满足训练次数N,得到中间网络模型;通过样本数据集对中间网络模型进行第二阶段的训练,直至第二阶段的训练次数满足训练次数N,得到用于数据集蒸馏的目标网络模型。
来源:金融界