狂飙半年的生成式人工智能系上了“安全带”。7月13日,国家网信办发布消息称,国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》(以下简称《办法》),自2023年8月15日起施行。国家网信办表示,出台《办法》,既是促进生成式人工智能健康发展的重要要求,也是防范生成式人工智能服务风险的现实需要。
以ChatGPT为代表的生成式人工智能的出现,意味着人工智能正式从1.0时代迈入2.0时代。创新工场董事长兼CEO李开复曾断言,AI 2.0是绝对不能错过的一次革命,它会是一个平台级别的趋势,超过移动互联网10倍。彭博行业研究曾在报告中预计,ChatGPT将给生成式人工智能市场带来为期十年的繁荣,市场规模将以42%的速度扩张。
抓住这一轮历史机遇至关重要。《办法》明确提及,鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系。
而在基础设施等方面,《办法》也提及,鼓励生成式人工智能算法、框架、芯片及配套软件平台等基础技术的自主创新。推动生成式人工智能基础设施和公共训练数据资源平台建设。促进算力资源协同共享,提升算力资源利用效能。推动公共数据分类分级有序开放,扩展高质量的公共训练数据资源。鼓励采用安全可信的芯片、软件、工具、算力和数据资源。
地方层面已有“回应”。以北京为例,今年5月,北京市启动通用人工智能产业创新伙伴计划。目前伙伴计划中,有10余家算力伙伴计划提供不少于4000P低成本优质算力,供北京市人工智能中小企业开展大模型训练和推理。10个数据伙伴开放18个、近500T高质量数据集供大模型企业训练使用。
生成式人工智能有理想的一面,也有现实的一面。正如国家网信办所言,近年来,生成式人工智能技术快速发展,为经济社会发展带来新机遇的同时,也产生了传播虚假信息、侵害个人信息权益、数据安全和偏见歧视等问题,如何统筹生成式人工智能发展和安全引起各方关注。
为此,《办法》也为生成式人工智能服务划出了诸多“红线”。例如数据方面,《办法》提到,生成式人工智能服务提供者(以下简称“提供者”)应当依法开展预训练、优化训练等训练数据处理活动,采取有效措施提高训练数据质量,增强训练数据的真实性、准确性、客观性、多样性等。
此外,提供者应当按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识。在信息安全方面,提供者应对使用者的输入信息和使用记录应当依法履行保护义务,不得收集非必要个人信息,不得非法留存能够识别使用者身份的输入信息和使用记录,不得非法向他人提供使用者的输入信息和使用记录等。
在答记者问时,国家网信办表示,《办法》提出国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管。
北京市社会科学院副研究员王鹏对北京商报记者分析称,《办法》对于什么是生成式人工智能、哪些行为合法、哪些行为违法等做出了明确的界定,有利于解决现实问题,也更有利于行业的规范发展。另外,《办法》也充分体现了我国对于人工智能,尤其是生成式人工智能鼓励、支持和引导的态度。整体来说,《办法》对于我国人工智能行业,包括基础研发、垂直落地应用以及相关生态的形成都是有利的。
北京商报记者 杨月涵