全国政协委员、中国科学院计算机所研究员张云泉。图/受访者供图
ChatGPT热度尚未退去,2024年伊始,以Sora为代表的文生视频AI工具的火爆,再次刷新了人们对人工智能大模型进化速度的认知。
3月4日,全国政协十四届二次会议在北京人民大会堂开幕。就当下人工智能发展中的人才培养、国产芯片和算力布局等热点问题,新京报新京智库专访了全国政协委员、中国科学院计算机所研究员张云泉。
张云泉委员长期从事人工智能领域的研究,对于我国在人工智能技术方面的发展有着独到的见解。
新京智库:你在提案中提到当前大模型发展也面临国产高端AI芯片供应不足和算力紧缺问题,您认为解决大模型算力瓶颈问题,我们该从哪些方面发力?
张云泉:在美国的封锁之下,我国能够用于大模型训练的国产智能算力芯片的创新和供应显著落后。而随着Sora文生视频工具的推出,反映出我国被拉开了更大的差距。
我认为在解决算力瓶颈方面可以从以下几个方面着手。
一是加大国产高端AI芯片研发。过去十五年,我国超算的研制水平已经达到世界领先水平,但是在面向消费电子商用芯片上仍在制造晶圆、光刻等环节受制于人。这就要求我们要加大对国产AI芯片的研发投入,提高芯片性能和效率。这有助于减少对进口芯片的依赖,确保算力供应的可持续性。
二是集中AI芯片研制力量。我们应该集中全国AI芯片研制力量,组建统一的研发团队。通过优中选优,尽快研制出能够对标英伟达高端训练GPU的大模型训练专用国产芯片、软件和系统。
三是设立智能算力发展专项组。我们可以组建由业内权威专家和各主要AI芯片厂家参加的智能算力发展专项组。通过多轮竞争,确定最优的训练芯片研发技术路线和国家标准。这有助于避免盲目建设和重复建设,促进良性发展。
新京智库:你在提案中也提到关于人工智能人才培养问题,你认为紧跟人工智能发展趋势,中国在人工智能人才培养方面需要注意哪些问题?
张云泉:截至2022年,我国在人工智能教育领域已取得显著成就,开设相关专业的高校达438所,研究中心68个,为培养新型人才打下了坚实基础。但是随着AI生成工具的不断涌现,目前在人工智能相关人才的培养上仍存在教育资源分配不均、课程内容更新滞后等问题。
对此,我在今年政协提案中建议,在紧跟人工智能发展趋势、培养人工智能人才方面,我提出需要关注以下几个问题。
一是教育资源均衡分配。尽管我国在人工智能教育领域取得了显著成就,但仍存在教育资源分配不均的问题。特别是偏远和农村地区,需要更多关注,确保他们也能获得必要的资源。
二是课程内容更新。随着AI生成工具的涌现,课程内容需要紧密跟进。我们应该鼓励高校更新课程,涵盖最新的人工智能技术和应用。
三是实践机会不足。学生在生成式人工智能技术上的实践能力至关重要。学校应与企业和研究机构合作,增加学生的实践机会。设立“生成式人工智能创新实践基地”等形式,鼓励企业提供实习机会和人工智能应用场景。
新京智库:你在提案中也提到有关于“东数西算”工程的规划和建设方面的建议。在你看来,“东数西算”工程的建设中,如何避免盲目建设和重复建设,确保健康发展?
张云泉: 2022年3月,国家发改委、中央网信办等四部门联合印发通知,同意在京津冀、长三角、内蒙古等8地启动建设国家算力枢纽节点。至此,全国一体化大数据中心体系完成总体布局设计,“东数西算”工程正式全面启动。
在我们考察和调研中,仍有一些问题暴露出来,需要及时纠正。
一是规划布局缺乏刚性约束。我们需要强化“东数西算”规划布局的刚性约束,明确国家枢纽节点外不得新建大型或超大型数据中心。这有助于避免盲目建设和重复建设,将国家枢纽节点打造成为国家算力高地。
二是资源存在不合理配置现象。例如,部分国家枢纽节点存在数据中心集群规划范围与市场自然形成的数据中心集聚区域重合度较低的问题。我们应该就近使用国家枢纽节点的算力资源,实现“东数东算”“西数西算”与“东数西算”的协同推进。特别是对于风光水电等清洁能源丰富、区位优势突出的非国家枢纽节点地区,我们应该支持建设高效低碳、集约循环的绿色数据中心,积极承接东部地区中高时延业务需求。
三是缺乏动态准入退出机制。我们要避免盲目发展,初始阶段已规划设立了10个数据中心集群,明确了发展目标。通过多方指标约束,促进集群高标准、严要求,最小化起步。随着发展情况,还应不断优化布局,适时扩大集群边界或增加集群,实现算力统筹有序、健康发展。对于发展滞后、运营能力不足的算力中心,可以适时进行清退。
新京报记者 查志远
编辑 柯锐
校对 李立军