“鼻祖”深蓝、AlphaGo再到ChatGPT,人工智能的发展似乎一直主导着前沿科技浪潮奔涌的方向。今年年初,对话AI模型ChatGPT刷爆了科技新闻的版面,不同于以往功能单一、频频失灵的“人工智障”,ChatGPT依托于海量算力和数据,能回答来自各领域“千奇百怪”的问题。
如此“智能”的技术也引发了很多思考:以ChatGPT为代表的人工智能通用基石模型将给社会带来哪些改变?其带来的科技伦理和数据泄露等问题该如何解决?为此,全国政协委员、民建四川省委副主委、西南财经大学大数据研究院院长寇纲今年带来了一份关于人工智能通用基石模型的提案,以期为我国人工智能发展献策。
全国政协委员、民建四川省委副主委、西南财经大学大数据研究院院长寇纲
寇纲在接受南都专访时表示,ChatGPT等人工智能通用基石模型依托海量数据库信息而存在,其对信息、数据来源无法进行事实核查,可能导致侵犯隐私、版权侵权等问题。为此,他建议在现有法律法规中明确人工智能通用基石模型及生成式AI技术和应用中涉及政治、民族、宗教、互联网等相关内容的法律底线和红线问题,推进建设AI内容监控平台。
探索数据共享补偿激励机制,激发流通热情
南都:四川省数字产业化发展呈“两极分化”,成都、绵阳远优于其他市(州)。据你观察,四川各市(州)处于怎样的竞合态势?如何促进各地平衡发展?
寇纲:“发展不平衡不充分”是四川数字经济的一个主要特点,体现在基础设施投入、数字技术研发创新、新型数字产业发展、传统产业数字化转型等方面。有数据显示,成都数字经济核心产业增加值规模占全省比重为64.3%,省内其他市州占比都比较低。
对此,我认为四川应围绕“一轴两翼三带”区域经济布局,探索“全省联动布局、区域跨界发展”新模式,注重产业在不同区域之间的梯度错位发展,避免新一轮的低端产能重复投入,造成资源浪费。
比如,着重关注川西丰富的文旅资源,加快培育文旅产业的多样化数字应用场景,形成VR预览景区环境、互动投影等多样化应用场景,拓展产业生态;加速能源领域的全流程数字化升级,重点关注四川水风光气氢多能产业,以乌东德、白鹤滩等重大水电工程为试点,加快能源生产、运输、储存、销售等环节的智能化改造等,打造四川先进产业“特色名片”。
南都:今年1月,首个国家级合规数字资产二级交易平台正式启动,四川也印发相关文件,明确提出建设数字资产交易中心。据你观察,国内数字资产交易现状如何?
寇纲:虽然数据被列为几大生产要素之一已经有比较长的时间,但数字资产交易仍是一个新鲜事物,国内外在这方面都缺乏成熟的实践经验。如今,国家对于数字资产交易转向了比较积极的态度,但整个市场体系尚未完全建立起来。
一方面是定价交易混乱的问题。给数据定价是进行交易的前提,而当前数字资产缺乏官方标准进行科学的价值评估,大都采用卖方自主定价的形式,存在极大的价格炒作空间,长远来看这对整个市场的稳定和发展是不利的。
另一方面,目前存在数据再流通价值缺失,市场活力不足的问题。国家鼓励数字资产的“去币化”,仅允许其进行一次性交易,禁止类金融、类证券化的交易模式。由于缺乏二次交易获利机制,现有的数字资产对不少企图在数字藏品市场创业和投资的长尾用户的吸引力持续衰退,市场活跃度随之降低。
南都:有观点认为,打破政企数据的“孤岛效应”是解决上述问题的当务之急。你怎么看?
寇纲:我们在成都的调研结果显示,目前政企数据共享确实存在难度,国家大力提倡“公共数据授权运营”,但运营需求清单同意提供比率不足50%。
究其原因,首先,我国的行政管理有垂直管理的特点,大量数据归口于不同委办局,国家部委部分下属机构都有着“数据不出部门”的要求,实现数据共享比较困难。其次,由于各自业务标准不同、精度不同、接口接入形式不同,数据颗粒仍偏向宏观,静态数据多于动态数据,导致数据的准确度、精细度、活跃度不足,数据很难使用。
不过,我在调研中发现,上海在这方面的做法非常值得借鉴。上海成立统一的大数据中心,将各部门相关数据强制性地全部统一到该中心进行归口管理,此举的改革力度非常大。据我了解,目前上海是唯一采用了这一方法的省市。
我建议,一方面,政府部门内部自己要梳理好标准规则,统一数据收集的标准。另一方面,优化现有数据授权机制,减少反复确认的中间环节,减轻部门数据共享顾虑;探索更加符合部门利益的补偿和激励机制,尝试与部门信息化资金挂钩,激发各部门数据流通热情,加大对社保、医保、公积金等高价值数据的保障力度。
建立全国一体化AI算力网络,弹性分配资源
南都:今年你带来一份关于人工智能通用基石模型的提案。为什么关注到这一话题?
寇纲:我认为,ChatGPT等人工智能通用基石模型是未来人工智能真正实现商业化广泛应用的一次突破,发展前景广阔。不过,虽然我国在人工智能领域发展较快,但自主研发的底层创新能力与美国相比还有较大差距,很多关键技术面临“卡脖子”难题。因此,我今年带来了《关于大力发展自主创新的人工智能通用基石模型的提案》。
我在提案中指出,我国人工智能领域自主研发能力亟待提升。目前我国底层架构软硬件基础几乎都由国外公司垄断,高质量的数据集已成为制约人工智能领域发展的瓶颈之一,比如很多国外数据集限制国内IP或直接不向国内用户提供服务。因此,我建议加大对人工智能基础领域自主研发的创新扶持,包括由工信部和科技部牵头,出台激励和引导人工智能大模型关键技术攻关和应用生态建设专项政策等。
此外,针对我国算力资源调配协同能力有待加强,各地算力使用分布不均,无法实现跨域的动态调配的问题,我建议促进全国一体化算力网络统筹调度,将各地分布的超算、智算、人工智能计算中心节点通过专线连接,形成全国范围内一体化感知、分配、调度人工智能算力网络,在此基础上实现资源弹性分配。
南都:ChatGPT 爆火后,国内企业也纷纷推出自己的语言模型产品。你看好它的商业前景吗?
寇纲:从产业角度来看,我认为它确实有很大的发展前景。过去的人工智能就像“手工定制”,不仅成本高,而且一个模型只能做一件事,比如AlphaGo只会下围棋,换成五子棋就不会了。不同的是,人工智能通用基石模型可以通过预训练,从大量标记和未标记的数据中捕获知识,面对新的任务和场景,它只需要少量的标注,就能达到极好的效果。
在我看来,人工智能通用基石模型在文本生成、图像生成、音频生成、视频生成、虚拟人、元宇宙等场景均有着丰富的应用场景,未来一定不会仅仅是大厂间的军备竞赛,普通企业、创业企业也可以从中受益,可以说是“兵家必争之地”。
南都:还有人担心ChatGPT会让“人工智能取代人类”成真。
寇纲:取代人类可能是一个过于夸张的说法。相反,我认为对于大多数人来说,这种技术会成为很好用的基础工具,尤其是针对高重复性、有规范性的工作,它会是一个提升效率的好帮手。所以,与其恐惧,不如巧用。
南都:ChatGPT 离不开大数据。在“大力出奇迹”式的训练方法背后,也隐含着科技伦理和数据泄露问题。你认为应该如何预防?
寇纲:由于ChatGPT这样的人工智能通用基石模型依托海量数据库信息而存在,它对信息、数据来源无法进行事实核查,确实很可能会导致提供虚假信息、侵犯个人隐私、泄露商业秘密等问题。比如,如果没有经过权利主体的授权,对部分受著作权保护的文本、视频、代码等进行直接获取、修改和拼凑,就可能涉及新型版权侵权。
对此,我建议加快互联网相关法律法规修订和伦理规范制定,在现有法律法规中明确人工智能通用基石模型及生成式AI技术和应用中涉及政治、民族、宗教和互联网等相关内容的法律底线和红线问题。同时,加快人工智能通用基石模型带来的知识产权保护研究,推进AI内容监控平台建设。
南都两会报道组出品
策划:程姝雯 潘珊菊 蒋琳
统筹:梁建忠
采写:记者 樊文扬