金融界 2024 年 12 月 21 日消息,国家知识产权局信息显示,紫光云技术有限公司申请一项名为“一种基于指定 GPU 线程的算法的模型训练方法”的专利,公开号 CN 119150942 A,申请日期为 2024 年 8 月。
专利摘要显示,本发明提供了一种基于指定 GPU 线程的算法的模型训练方法,包括:选择 GPU 硬件和深度学习框架;设计并定义深度学习模型的结构和参数,为后续训练做准备;准备训练数据,并将训练数据加载到 GPU 内存中,为模型训练提供所需的数据输入;采用 GPU 线程管理策略保证用户精确控制训练过程中 GPU 线程的数量、分布、调度和优先级,以优化并行性;通过内存管理和数据传输优化技术,减少 GPU 与 CPU 之间的数据传输,并降低训练期间的内存占用。本发明有益效果:通过明确指定 GPU 线程、内存管理、数据传输优化、并行化训练算法和自动性能调整等方面的创新,解决了与 GPU 并行计算相关的一系列挑战,有望显著提高深度学习模型训练的效率和性能。
来源:金融界