当前位置:首页|资讯|AIGC|人工智能

谁来为AIGC负责——简评生成式人工智能管理新规

作者:陆家嘴传媒发布时间:2023-07-17

原标题:谁来为AIGC负责——简评生成式人工智能管理新规

2023年4月11日,《生成式人工智能服务管理暂行办法》正式落地。本文将通过对AIGC的训练数据、算法、内容生成等方面的监管和责任承担等焦点问题进行分析,并提出相应的法律建议以作为参考。

2023年4月11日,国家互联网信息办公室(以下简称“网信办”)发布《生成式人工智能服务管理办法(征求意见稿)》(以下简称“《征求意见稿》”)。经过1个月的征求意见和3个月的酝酿,生成式人工智能管理新规终于落地。2023年7月13日,网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布《生成式人工智能服务管理暂行办法》(以下简称“《办法》”),自2023年8月15日起施行。《办法》的落地意味着生成式人工智能监管有了更为直接且明确的监管依据。

在现行法律框架下,人工智能并不具有中国《民法典》项下的民事法律主体资格,人工智能应用导致的人身损害、财产损失或其他不利后果,相应的责任只能由相关的法律主体来承担。以生成式人工智能为例,人工智能生成物(以下简称“AIGC”)可能涉及不同的法律主体,至少包括服务提供者和服务使用者。然而,作为新技术,由生成式人工智能导致的损害,其归责并不如一般侵权责任规则方式如此清晰。而本次《办法》的发布,对AIGC的训练数据、算法、内容生成等问题的监管和责任承担都给出了明确的指引和规则。

一、什么是生成式人工智能?

在境外,ChatGPT、Stable Diffusion、Midjourney等各类人工智能产品迅速迭代更新;在境内,2023年7月6日至8日,在上海举行的2023世界人工智能大会上,以“智联世界 生成未来”为主题,大会共对接210家上下游企业,达成110亿意向采购金额,推动32个重大产业项目签约,项目投资总额288亿,精彩纷呈、硕果累累。当下,人工智能热度席卷全球,生成式人工智能更是受到热烈追捧。

究竟什么是生成式人工智能?从技术和商业角度可谓仁者见仁智者见智。而《办法》对于生成式人工智能技术给出的定义为:“生成式人工智能技术,是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术。”

二、《办法》的适用范围

《办法》第二条规定:“利用生成式人工智能技术向中华人民共和国境内公众提供生成文本、图片、音频、视频等内容的服务(以下称生成式人工智能服务),适用本办法。”

从该条规定来看,《办法》适用的地域范围为中国境内。并且,即使生成式人工智能服务来源于中国境外,但向中国境内提供服务的,也应受限于《办法》相关规定。

值得注意的是,较《征求意见稿》,《办法》第二条删除了“研发”字样,《办法》针对的并非生成式人工智能这一技术,而是利用生成式人工智能产品提供的“服务”。因此,研发生成式人工智能技术并不属于《办法》的监管范围之内。

三、谁来为AIGC负责?

通读《办法》可以发现,生成式人工智能服务提供者(以下简称“提供者”或“服务提供者”)是主要的责任承担主体。根据《办法》的定义,生成式人工智能服务提供者,是指利用生成式人工智能技术提供生成式人工智能服务(包括通过提供可编程接口等方式提供生成式人工智能服务)的组织、个人。

(一)谁来为训练数据负责?

根据《互联网信息服务深度合成管理规定》(以下简称“《深度合成规定》”),训练数据是指“被用于训练机器学习模型的标注或者基准数据集。”训练数据与人工智能之间的关系就好比燃料和发动机,没有训练数据,人工智能就无法正常运作。海量的训练数据是人工智能深度学习的基础。训练数据在处理过程中可能涉及到数据来源、数据清洗和脱敏、数据标注等多个方面的法律风险。

训练数据之于生成式人工智能技术如此重要,那么训练数据如何管理呢?

1.数据来源

人工智能依赖于庞大的数据量作为支撑。这些数据来源通常包括公开渠道获取、采购等间接方式获取。但在这其中需要注意,利用爬虫程序等方式采集公开数据是否违反了robots协议、通过采购等方式间接获取数据是否取得了必要授权、用户输入内容作为训练数据是否涉嫌侵犯了用户个人信息权等。

《办法》第七条要求提供者对预训练数据、优化训练数据来源的合法性负责,并强调了训练数据不得侵害他人知识产权。

但是,对实践中疑问讨论较多的服务提供者能否将使用者输入内容用作训练数据之问题,《办法》似乎没有给出明确答案。

2.训练数据质量

《办法》第七条第四项要求提供者需要“采取有效措施提高训练数据质量,增强训练数据的真实性、准确性、客观性、多样性”。并且,在训练数据的选择上,尤其应注意避免防止产生民族、信仰、国别、地域、性别、年龄、职业、健康等歧视。

3.训练数据标注

《深度合成规定》原则性地提及了要加强训练数据的管理,保障训练数据的安全。

而《办法》则对训练数据方面给出了更为细化的规定,包括训练数据标注规则和标注人员的要求。《办法》第八条规定:“在生成式人工智能技术研发过程中进行数据标注的,提供者应当制定符合本办法要求的清晰、具体、可操作的标注规则;开展数据标注质量评估,抽样核验标注内容的准确性;对标注人员进行必要培训,提升尊法守法意识,监督指导标注人员规范开展标注工作。”

(二)谁来为个人信息处理负责?

生成式人工智能服务面向的使用者范围广泛,不可避免地涉及海量个人信息的处理。就个人信息处理而言,《办法》第九条明确规定了由服务提供者依法承担个人信息处理者责任。

根据《办法》,服务提供者的个人信息保护义务至少包括:训练数据涉及个人信息训练数据应当遵循个人同意原则及相关法律规定;此外,《办法》第十一条还对服务提供者施加了对使用者的输入信息和使用记录的保护义务,包括“不得收集非必要个人信息,不得非法留存能够识别使用者身份的输入信息和使用记录,不得非法向他人提供使用者的输入信息和使用记录”。

(三)谁来为算法负责?

算法是人工智能的灵魂。《互联网信息服务算法推荐管理规定》(以下简称“《算法规定》”)于2021年12月31日发布,2022年3月1日生效。《办法》对生成式人工智能算法管理在《算法规定》的基础上进一步地细化,并规定了服务提供者为生成式人工智能算法管理的责任主体。

首先,如果生成式人工智能服务具有舆论属性或者社会动员能力,服务提供者利用生成式人工智能产品向公众提供服务前,需要开展安全评估和算法备案。目前,安全评估主要指按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估;算法备案指按照《算法规定》履行算法备案和变更、注销备案手续。《算法规定》要求具有舆论属性或者社会动员能力的算法推荐服务提供者应当在提供服务之日起十个工作日内通过互联网信息服务算法备案系统填报服务提供者的名称、服务形式、应用领域、算法类型、算法自评估报告、拟公示内容等信息,履行备案手续。

其次,服务提供者应当在算法设计过程中采取措施防止出现民族、信仰、国别、地域、性别、年龄、职业、健康等歧视。另外,服务提供者不得利用算法优势实施垄断和不正当竞争行为。

最后,服务提供者应当根据配合监管,按要求对算法机制机理等向主管部门予以说明。

(四)谁来为人工智能生成内容负责?

《办法》第九条规定,服务提供者需承担网络信息内容生产者责任,履行网络信息安全义务。相较于《征求意见稿》,《办法》保留了由服务提供者承担内容生产者责任,但更为强调网络信息安全;此外,《办法》删除了讨论过程中争议较大的《征求意见稿》第十五条对模型优化训练3个月的期限,某种程度上降低了服务提供者研发运维的成本。

《办法》还要求生成式人工智能服务不能生成违法违规内容和歧视性内容。《办法》第十四条进一步要求,当服务提供者发现违法内容,应当及时采取停止生成、停止传输、消除等处置措施,采取模型优化训练等措施进行整改,并向有关主管部门报告。

四、《办法》的归责逻辑

乍看之下,将服务提供者列为AIGC的责任主体,似乎这一规定有失公允。虽然服务提供者提供了AIGC的生成服务;但是,AIGC的生成还须有服务使用者的使用,包括输入关键词、输入生成条件等,人工智能产品系根据服务使用者输入的指令或要求生成了一定的文字、图像或声音等内容。在此情况下, AIGC的生成与服务使用者的行为是存在一定的因果关系,但为何《办法》仅要求服务提供者承担内容生产者的责任,而不要求服务使用者承担责任呢?或者不要求服务提供者和服务使用者按一定比例承担责任呢?

进一步而言,将所有的责任均归于服务提供者,是否会对服务提供者而言过于严苛,使服务提供者面临过高的成本与风险,从而遏制生成式人工智能行业的快速发展呢?

其实,并不尽然。《办法》归责逻辑考虑了服务提供者的技术优势和既有规定的规则,与既有规定形成完整了逻辑自恰的监管体系。

1.技术优势

服务提供者掌握了生成式人工智能产品的技术底层,包括训练数据和算法。一方面,服务提供者控制了训练数据范围、规模和标注方式;另一方面,服务提供者也控制了生成式人工智能产品的算法,包括AIGC的形式、格式、风格,甚至是舆论导向。简言之,在生成式人工智能产品技术层面,相对服务使用者而言,服务提供者占据了绝对优势地位。服务使用者几乎不可能利用生成式人工智能产品生成超越服务提供者所设定的训练数据和算法以外的内容。举例而言,某一AI绘画服务提供者,如果将其产品设定为仅提供中国古典风格绘画作品,并仅向人工智能“投喂”了中国古典风格绘画作品的相关数据,那么无论服务使用者在使用过程中输入什么关键词或条件,该等AI绘画产品几乎不可能生成欧洲文艺复兴时期风格的画作。

2.既有规定的逻辑

生成式人工智能产品的服务提供者从本质上也是互联网服务提供者。根据《民法典》第一千一百九十五条规定,网络服务提供者在收到侵权通知时,必须立即转送通知并采取阻断措施防止侵权损害扩大,否则将对损害的扩大部分与侵权用户承担连带责任。《互联网信息服务管理办法》不仅禁止互联网服务提供者制作、复制、发布、传播《互联网信息服务管理办法》第十五条规定的内容(以下简称“有害内容”),并且互联网信息服务提供者发现其网站传输的信息明显属于有害内容的,还须履行停止传输、保存记录和报告义务。

从上述规定来看,互联网信息服务提供者对于防范和制止有害内容或侵权内容的传播承担法定责任。所以,《办法》的规定与既有规定在这方面的逻辑是一脉相承的。

五、服务提供者的应对策略

《办法》将服务提供者列为主要的责任承担者。服务提供者应对如何应对,确保合规运营,有效预防和化解风险呢?

首先是建章建制。从训练数据的处理到算法设计,再到模型优化,服务提供者需要依照法律法规和《办法》的要求,建立规章制度和合规流程,为合规运营提供制度保障。

其次是人员培训。服务提供者应当通过培训提高工作人员的合规意识和合规能力。同时,这也是《办法》的要求。根据其规定,训练数据标注人员应当经过必要培训。

第三是合理分散风险。《办法》第九条第二款要求“提供者应当与注册其服务的生成式人工智能服务使用者(以下称使用者)签订服务协议,明确双方权利义务。”服务提供者可以考虑,在服务协议中,对于服务使用者应当如何适用生成式人工智能服务予以明确约定,并考虑约定在服务使用者违规违约使用生成人工智能服务造成服务提供者损失的情况下,服务提供者拥有追偿的权利。

最后是防止风险扩散。服务提供者应当按照《办法》第十四条的规定,就违法内容和违法活动履行处置义务和报告义务,

结语

生成式人工智能是人工智能领域的组成部分,虽然发展迅速,但仍是处于牙牙学语之中。而在生成式人工智能处于起步阶段即纳入监管,有助于实现技术发展和监管治理两不误。对于企业来说,应当遵守相关规定,尽早防范风险,以促进生成式人工智能健康、可持续发展。

作者介绍

樊晓娟律师系中伦律师事务所合伙人,毕业于上海对外经贸大学法学院、美国加州大学洛杉矶分校法学院,系中国执业律师,及美国纽约州律师资格和中国注册税务师资格,并担任中国移动通信联合会元宇宙产业工作委员会常务委员、中国国际商会区块链创新服务产业委员会委员、横琴数链数字金融研究院学术与技术委员会委员。

作为数字法律4C(Cyber Space、Compliance、Capital Market、Cross-border)律师,樊律师为AIGC、人工智能、虚拟数字人、数据合规与安全、算法、区块链、元宇宙与数字资产等领域的众多前沿科技行业的客户提供专业的法律服务,并多次受邀参加撰写报告、在专业论坛发表主题演讲等,并撰写了包括《人工智能发展合规白皮书》《虚拟与现实共存——关于元宇宙的法律思考》等著作文章。

从业十多年来,樊律师在资本市场领域,尤其是在前沿科技和高科技产业的资本运作等方面颇有建树,陪伴诸多新兴科技企业从创业、融资到成功登陆海内外资本市场。

本文旨在法规之一般性分析研究或信息分享,不构成对具体法律的分析研究和判断的任何成果,亦不作为对读者提供的任何建议或提供建议的任何基础。作者在此明确声明不对任何依据本文采取的任何作为或不作为承担责任。如需转载或引用本文的任何内容,请联系作者(fanxiaojuan@zhonglun.com;未经作者同意,不得转载或引用本文的任何内容。

如有疑问或投稿,可发送邮件至lujiazui@yicai.com

· 好 问 ·

谱润投资 周林林:青衿之志,履践致远 | 好问 ·人物志 | 刘欣:20年的探索——什么才是真正有意义的员工福利保障?

· HOW ·

SGS风险管理解决方案中心总经理岳庆松 | 金仕达 | 小村资本 梅晨斐 | 上海市天使投资引导基金负责人 董若愚 | 明善资本 张小冬:在能力圈内行动,在舒适圈外学习 | 兴富资本 王廷富:聚焦资源优 势、专注企业价值 | 海松资本 陈立光:从产业中来到产业中去 让投资创造价值

· 投 资 峰 会 ·

遇见挑战 拥抱机遇 “2023第一财经产业投资榜”正式颁布!

锚定价值,探索未来 | 2022陆家嘴投融资峰会暨第一财经股权投资峰会开幕


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1