自2022年底ChatGPT发布以来,全球范围内掀起了人工智能大模型发展浪潮,各地政府纷纷抢占大模型训练制高点。作为贵州发展数字经济的主要承载地,贵阳市和贵安新区能为大模型训练提供什么样的条件?
贵阳市市长马宁宇出席2024数博会新闻发布会。摄影/覃伟
7月30日上午,贵阳市人民政府市长马宁宇在京出席2024中国国际大数据产业博览会(以下简称数博会)新闻发布会,就此回应了南都记者提问。
他表示,贵阳贵安将以国家实施“东数西算”为重要契机,充分发挥数据中心集群、算力规模、数据开放和应用场景等方面的优势,全力建设人工智能大模型的训练基地。
《流量地球2》等大片渲染制作,由贵州算力提供服务
“我们提出要建五个中心:智算服务中心、模型训练中心、数据流通中心、人才培养与联合创新中心、产业赋能中心。”马宁宇对南都记者表示,贵阳贵安将以此构建人工智能大模型生态体系,为全社会生产生活提供普惠、易用、低价、绿色和安全的算力服务。
具体怎么做?马宁宇介绍了当地助力人工智能大模型发展的相关举措。
首先要提供充沛的低成本算力,“让企业像使用电力一样,方便安全地使用算力服务,开展大模型训练。”据马宁宇介绍,截至目前,贵阳贵安智算规模超过33Eflops(每秒进行百亿亿次浮点运算的能力),预计今年年底将超过75Eflops,成为全国国产化智算能力最强的地区。
在政策支持方面,马宁宇说贵州省市专门还拿出一大笔资金,叠加“算力券”政策,为使用算力的企业提供优惠支持。
南都记者注意到,今年以来,多地纷纷发放“算力券”,加持人工智能产业发展,而贵州是全国范围内较早推出这一政策的地区之一。
据新华社报道,今年2月29日,贵州向72家省内外企业发放首批“算力券”,以用于其购买当地算力服务或数据交易产品时抵扣一定比例费用。
南都记者了解到,2024年贵州拟发放总额1亿元的算力券,包含现金券和若干实物券。用好“算力券”政策,贵州提出要大力开拓算力市场,力争2024年带动算力产业规模突破100亿元。
值得关注的是,贵州算力已开始影响人们的生活方式。当天新闻发布会上,贵州省大数据发展管理局局长景亚萍举例道,现在观众看到的《流浪地球2》《三体》等众多大片的渲染制作,许多都是在贵州提供算力服务。
“未来大家用到的无人驾驶,我想有可能由贵州算力提供计算服务。”她说。
据景亚萍介绍,下一步,贵州省将抢占智算制高点,大力推动智算中心建设,持续开展行业大模型应用场景开放,吸引更多数据标注、数据治理和数据训练等领域来贵州布局发展创业。同时布局对算力需求和数据需求旺盛的未来产业——人工智能、渲染、低空经济,培育智算产业生态,来打造自主可控的国产化算力服务体系。
提供高质量数据集,开放应用场景
除了“拼算力”,贵阳贵安还在开源模型训练平台和数据集上下功夫。
“为降低模型训练成本,我们专门搭建公共服务平台,提供开源的基础模型和优惠算力,集成各种优秀的算法,为大模型企业提供模型预训练、模型调优推理、安全评测以及模型管理等等,来支持大模型一站式训练、推理、部署和运维。”马宁宇说。
大模型的训练离不开数据,数据质量决定了大模型能力的上限。如何为大模型厂商提供数据“燃料”?马宁宇提到了贵阳大数据交易所,称以此平台为大模型训练提供高质量训练数据集。
据南都记者了解,贵阳大数据交易所成立于2015年,是全国第一家数据交易所。目前首批挂牌的训练数据集包括金融服务、工业制造、医疗健康、商贸流通等多个领域,涉及文字、音频、图片、视频等多种模态,还包括一批骨干企业机构。
大模型的落地应用,也是业界尤为关注的焦点问题,对此地方正在积极探索,创造良好环境。据马宁宇介绍,贵阳贵安是全国较早开展公共数据授权开发使用的城市,在教育、旅游、医疗、数字人等各方面应用场景丰富、数据资源充足。
聚焦重点领域和行业,贵阳贵安正联合头部企业,搭建开放式创新平台,建设适配中心,并邀请优秀企业共同开展人工智能技术创新和应用研究,为大模型的商业化应用探索模式和路径。
“我们自己的智慧城市建设、‘城市大脑’,贵阳市城市运营中心将提供一批场景,包括水利、应急、城市安全等垂类大模型,我们也提供应用机会、应用场景。”马宁宇说。
采写:南都记者李玲 发自北京