金融界2024年10月24日消息,国家知识产权局信息显示,中电信人工智能科技(北京)有限公司申请一项名为“大语言模型构建方法、文本处理方法、系统、设备及介质”的专利,公开号 CN 118798258 A,申请日期为2024年7月。
专利摘要显示,本申请实施例提供了一种大语言模型构建方法、文本处理方法、系统、设备及介质,属于人工智能技术领域。该方法通过训练数据集对文本处理基础模型的所有网络层进行训练得到第一语言模型,然后对第一语言模型的所有网络层进行划分,前部分的若干个网络层作为共享网络,后部分的若干个网络层作为专家网络通过各个领域文本子集分别训练第一语言模型的专家网络,得到各个能够处理特定领域特征的领域专家网络,通过路由器模块连接共享网络和各个领域专家网络得到第二语言模型,然后对第二语言模型进行训练得到用于文本处理的大语言模型,使得路由器模块能够选择合适的领域专家网络处理相应的输入特征,提高大语言模型对各种领域文本处理的准确性。
来源:金融界
柒柔学姐 2024-12-15
钱17779130177 2024-12-15
统威金属-厂家老统威 2024-12-15
智遇未来LGB 2024-12-15