日前,省发展改革委(省数据局)发布“四川省首批人工智能高质量数据集”。记者注意到,我省首批8个人工智能高质量数据集均来自成都企事业单位。
高质量数据集是经过清洗、标注等数据处理后,在格式、质量等方面符合相关要求,以文本、图像、音频、视频等多模态呈现,可直接用于开发和训练人工智能模型的数据集,包含行业通识和行业专识数据集。
国家数据局局长刘烈宏指出,“高质量数据是人工智能发展的根基。”我省首批人工智能高质量数据集充分利用我省海量数据资源,严格按照国家有关标准和要求打造,包括文本75.69TB、图像20.35PB、音频22.83TB、视频1.2PB、3D模型62TB,可用于医药研制、商贸流通、公共安全、能源调度等各类应用场景,对推动我省人工智能产业进一步建圈强链,加快进入全国人工智能第一方阵具有重要推动作用。
市发展改革委相关负责人表示,下一步将继续支持和鼓励行业企业、数商和社会资本,整合公共数据、企业数据等各类数据资源,建设更多具有成都特色、符合国家标准要求的行业高质量数据集,更好的服务和支撑本地大模型开发和训练,助力人工智能产业发展。后续将持续开展行业高质量数据集征集工作,并分批次予以发布。