当前位置:首页|资讯|人工智能

关于AI模型训练改进之专利布局浅见

作者:小猫和商标发布时间:2023-12-20

摘 要


按照中国专利审查指南修订内容可知,人工智能算法若能与具体的技术应用领域结合,或者能够对计算机系统的内部性能进行改善,则能够符合中国专利法中关于专利保护客体的规定,进而可能获得专利权。人工智能算法创新持续不断,如此多涉及人工智能算法模型的改进方案,该采用怎样方式进行专利布局,以获得更加全面、有效的保护是值得探讨的。本文主要从产业链布局角度和专利侵权角度分析人工智能算法模型改进方案在专利布局上可以采取的一些策略,希望能抛砖引玉、引发更深层次的探讨。


关键词:人工智能;模型改进;专利布局;产业链;专利侵权

 >>>  一、引 言

随着人工智能技术的逐步发展、成熟,人工智能技术被广泛应用于各个领域,如:智慧交通、智能医疗、智慧金融、智慧家庭等等;产出了较多热门产品,如:智能汽车、机器人、智能家居等,给人们的生活带来了便利。各类智能产品需要人工智能算法来实现,关于人工智能算法的创新越来越多,因而涉及人工智能领域的专利申请是否符合专利保护客体,以及是否能够获得专利权,成为人们关注的焦点。
中国国家知识产权局在2021年8月13日公布了《专利审查指南修改草案(征求意见稿)》,在该征求意见稿中第二部分第九章6.1.2补充了涉及人工智能领域的专利申请是否符合专利保护客体,以及关于新颖性和创造性评判等相关的审查标准[1]。按照中国专利法及专利审查指南修订内容的相关规定,如果人工智能算法能够对计算机系统的内部性能进行改善,或者与具体应用领域结合以解决具体应用领域的技术问题,并获得相应的技术效果,则属于专利保护客体。按照目前专利审查指南的修订内容,人工智能领域的专利申请有获得专利权的可能,为此笔者不再讨论人工智能算法与专利保护客体相关的问题,而是从检索现有的关于人工智能算法模型改进的专利申请案例的布局方式出发,主要探讨关于人工智能算法模型改进、相关专利布局等话题,并提供一些专利布局策略,以期帮助相关专利权人获得更加全面、有效的专利保护。

 >>>  涉及人工智能算法模型训练创新的专利保护布局的几种常见方式


涉及人工智能算法模型训练的创新点主要包括:

  • 样本数据

  • 模型结构

  • 模型参数

  • 损失函数等


关于创新点在人工智能算法模型训练的创新,属于《专利审查指南》第九章中规定的涉及计算机程序的发明专利申请,申请人通常会布局方法权利要求产品权利要求

  • 方法权利要求用于保护计算机程序在计算机上运行的过程

  • 产品权利要求包括程序模块架构的装置、实体硬件(计算机设备、计算机可读存储介质)、计算机程序产品等

不难看出,产品权利要求的布局均是以计算机程序实现的方法流程为基础对应架构的相关产品权利要求。基于此,笔者以方法权利要求布局角度来进行讨论。

笔者通过对检索得到的专利文献分析发现,目前专利文献中关于人工智能算法模型训练的方法权利要求布局主要有以下五种布局方式:

(一)模型训练过程和模型应用过程分别单独布局权利要求,且两者互不关联


案例一


CN114170547A


权利要求1:

一种交互关系检测方法,其中,包括:

获取待检测图像;

利用训练过的交互关系检测模型对所述待检测图像进行交互关系检测;其中,所述交互关系检测模型,用于:根据所述待检测图像,……,得到第一交互关系检测结果。


权利要求2:

一种模型训练方法,其中,包括:

获取带有交互关系标签的样本图像;

……对所述交互关系检测模型进行参数优化;其中,所述交互关系检测模型,用于:根据所述样本图像,……,得到第一样本交互关系检测结果;所述目标样本交互关系检测结果是根据所述第一样本交互关系检测结果确定的。


权利要求3:

一种交互关系检测方法,其中,包括:

获取交通摄像设备拍摄的交通图像;……;

利用训练过的交互关系检测模型对所述交通图像进行交互关系检测;其中,所述交互关系检测模型,用于:根据所述交通图像,……,得到第一交互关系检测结果。

分析如下:

在案例一中,创新点在人工智能算法模型结构上,模型训练过程和模型应用过程都有相同的模型结构,无论是在训练,还是在应用,两者对数据处理具有相同的处理逻辑。如此,模型训练和模型应用分别单独进行布局,既能体现相应的创新点,且两组权利要求之间也相互不影响。


(二)模型训练过程和模型应用过程分别布局权利要求,模型应用的权利要求采用引用模型训练过程各权利要求方式


案例二


CN113343132A


权利要求1:

一种模型训练的方法,其特征在于,包括:

获取训练样本,……;

通过待训练的排序模型,确定……;

根据……,训练所述排序模型。


权利要求8:

一种信息展示的方法,其特征在于,包括:

接收用户输入的搜索语句;

……将所述各搜索结果输入到预先训练的排序模型中,得到所述搜索语句对应的排序结果,所述排序模型是通过上述权利要求1~7任一项方法训练得到的;……。


分析如下:

在案例二中,权利要求1布局了根据模型训练方法得到模型,权利要求8布局了模型应用的方法,且引用了模型训练的权利要求中任一项,如此模型应用的技术方案包括了所引用的权利要求中模型训练的全部技术特征,同时还包括了模型应用的技术特征。


(三)模型应用过程作为独立权利要求和模型训练作为模型应用过程的从属权利要求布局,以及模型训练过程作为独立权利要求布局


案例三


CN111191791A


权利要求1:

一种机器学习模型的应用方法,其特征在于,所述方法包括:

获取当前任务的预测样本;

调用适用于所述当前任务的机器学习模型;

通过所述机器学习模型输出所述预测样本对应的预测结果;

其中,所述机器学习模型是……样本数据进行训练得到的。


权利要求2:

根据权利要求1所述的方法,其特征在于,所述机器学习模型的训练过程如下:

确定所述当前任务与所述历史任务之间的相关性;

……所述当前任务的机器学习模型。


权利要求8:

一种机器学习模型的训练方法,其特征在于,所述方法包括:

确定当前任务与历史任务之间的相关性;

……得到适用于所述当前任务的机器学习模型。


分析如下:

在案例三中,权利要求1布局了模型应用过程的技术方案,且在权利要求中对模型训练仅做了突出创新点的限定,权利要求2作为权利要求1的从属权利要求布局了模型训练过程。权利要求8单独布局了模型训练过程的技术方案。


(四)模型应用过程作为独立权利要求,模型训练过程作为模型应用权利要求的从属权利布局


案例四


CN114090726A


权利要求1:

一种文本意图识别方法,其特征在于,包括:

根据预先构造的实体字典库,……确定所述待识别文本对应的意图。


权利要求7:

根据权利要求1-6中任一项所述的方法,其特征在于,所述意图文本识别方法是通过网络模型执行的,所述网络模型通过以下步骤训练得到:

获取第一文本序列;

……调整所述网络模型的模型参数,以对所述网络模型进行训练。


分析如下:

在案例四中,权利要求1布局了模型应用过程的技术方案,权利要求7作为权利要求1的从属权利要求布局了模型训练过程。


(五)模型训练过程布局独立权利要求,模型应用过程作为模型训练过程权利要求的从属权利要求布局


案例五


CN114067321A


权利要求1:

一种文本检测模型训练方法,其特征在于,包括:

获取样本图像集合,其中,每个样本图像包含至少一个真实文本对象;

基于所述样本图像集合,……确定目标损失值,并采用所述目标损失值进行参数调整。


权利要求10:

如权利要求1至9任一所述的方法,其特征在于,所述基于……之后,还包括:

获取待处理图像;……;

采用所述目标文本检测模型,对所述多个目标文本框图像进行实例分割,获得至少一个目标文本对象。


分析如下:

在案例五中,权利要求1布局了模型训练过程的技术方案,权利要求10作为权利要求1的从属权利要求布局了模型应用过程。


 >>>  三、涉及人工智能算法模型训练创新的专利保护布局建议


上面结合几个案例分析了目前涉及人工智能算法模型训练的改进方案专利布局的多种方式,那么该如何灵活运用这些方式来布局权利要求才较为合理呢?下面分别从产业链角度、获取证据的容易程度和专利侵权角度进行分析。


(一)从产业链角度分析


为了更容易理解,我们先以硬件产品阐述:

对于一件硬件产品,在进行专利布局时,通常会从具有创新点的最小可出售单元,按照该最小可出售单元所在的产业链从上游到下游分别布局,例如改进的最小单元为指纹盖板,则进行专利布局时,通常会布局指纹盖板/具有指纹盖板的指纹模组/具有指纹模组的电子设备等。


从产业链角度将硬件产品的上下游产品均布局相应的权利要求进行保护,可以覆盖到指纹盖板的制造者,使用指纹盖板制造指纹模组的制造者,使用具有该指纹盖板所在的指纹模组进一步加工得到电子产品的制造者。


人工智能算法模型包括模型训练阶段和模型应用阶段。类比于硬件产品,我们若将人工智能算法模型当做软件产品,则模型训练阶段相当于软件产品的制造过程,模型应用阶段相当于软件产品的使用过程。显然,软件产品的制造过程和使用过程可以为同一人实施,也可以为不同人实施,即模型训练阶段和模型应用阶段可以是同一实施者,也可以是不同的实施者。再者,软件产品的制造过程和使用过程也不相同。从全面保护的角度考虑,需要对软件产品的制造过程和使用过程均进行专利保护,也就是对模型训练和模型应用分别独立布局权利要求进行,这样不管模型训练过程和模型应用过程的实施者是同一人,还是不同人,其侵权行为都能被权利要求所覆盖。为了体现模型应用的创新点,可以进一步将模型训练作为模型应用的从权进行布局,以确保模型应用的创新性。


(二)从专利侵权角度分析


1、专利侵权判定的全面覆盖原则


《最高人民法院关于审理专利纠纷案件适用法律问题的若干规定》第十七条第一款:专利法第五十九条第一款所称的“发明或者实用新型专利权的保护范围以其权利要求的内容为准,说明书及附图可以用于解释权利要求的内容”,是指专利权的保护范围应当以权利要求记载的全部技术特征所确定的范围为准,也包括与该技术特征相等同的特征所确定的范围[2]


《最高人民法院关于审理侵犯专利权纠纷案件应用法律若干问题的解释》第七条:人民法院判定被诉侵权技术方案是否落入专利权的保护范围,应当审查权利人主张的权利要求所记载的全部技术特征。被诉侵权技术方案包含与权利要求记载的全部技术特征相同或者等同的技术特征的,人民法院应当认定其落入专利权的保护范围;被诉侵权技术方案的技术特征与权利要求记载的全部技术特征相比,缺少权利要求记载的一个以上的技术特征,或者有一个以上技术特征不相同也不等同的,人民法院应当认定其没有落入专利权的保护范围[2]


由此可知,《最高人民法院关于审理专利纠纷案件适用法律问题的若干规定》第七条和第十七条确定了专利权利要求解释的全部技术特征原则,即被诉侵权技术方案的技术特征与权利要求记载的全部技术特征相同或等同的,人民法院应当认定其落入专利权的保护范围。


针对涉及人工智能算法模型的专利申请来说,若在模型应用的权利要求中包含了模型训练的技术特征,并获得了专利权,在后续专利维权过程,专利权人利用模型应用的权利要求去告被诉对象侵犯其专利权时,需要证明被诉对象所实施的技术方案既包含了模型应用的技术特征,也包含了模型训练的技术特征,才可能被认定为落入专利权的保护范围。从这一点出发,在布局模型训练的权利要求和模型应用的权利要求时,分别单独描述各自所具有的技术特征较为合理。


2、专利侵权中获取证据的相对容易程度


硬件产品的权利要求通常会从硬件产品自身所具有的特征角度出发描述,即硬件产品的结构、形状等容易感知到的技术特征,这样在专利申请后续程序,如专利侵权判定中特征的分析比对时,可以较为容易地获取可疑产品,将可疑产品与产品权利要求的技术特征进行比对,从而判断是否侵犯专利权。而硬件产品的制造方法通常是在生产车间内,通常属于较为保密的场所,难以获取相关制备过程的证据。


类似的,模型训练阶段保护软件产品的制造过程也类似于描述实体产品的制备过程,不容易获取相关的证据;模型应用阶段保护软件产品的使用过程也类似于描述软件产品自身所具有的特征,相对于模型训练阶段容易获取相关的证据。从取证容易程度出发,会优先考虑布局模型应用权利要求。当然,涉及人工智能算法模型的专利申请,因其过程属于计算机后台执行的过程,一般情况下较为难以取证,为此也需要考虑尽可能采用能够容易被检测到的技术特征来表述方案。


通过上述分析可知,涉及人工智能算法模型训练的创新:

  • 从产业链角度考虑,为了保护全面,模型训练和模型应用均需要布局,同时,可将模型训练作为模型应用的准备过程,布局在模型应用这一套保护主题的从属权利要求中;

  • 从专利侵权角度考虑,基于专利侵权判定的全面覆盖原则,模型训练和模型应用分别单独布局权利要求,且采用各自所具有的特征进行表述较为合理;

  • 从专利侵权中取证的容易程度考虑,因模型应用的权利要求描述的是软件产品自身运行所体现的特征,模型训练的权利要求描述的是软件产品制备的特征,软件产品自身的特征相比于软件产品制备的特征更容易证明,故优先布局模型应用的权利要求,其次,在布局模型训练的权利要求,具体如表1所示。

涉及人工智能算法模型的创新点在于模型训练,该模型训练主要包括样本数据、模型结构、模型参数、损失函数等,模型应用过程通常是将训练好的模型当做黑盒子进行使用,即将A数据输入到黑盒子中,然后输出B数据,看不出有什么创新的地方。那么,在模型应用中不引入模型训练的技术特征时,如何体现出模型应用过程的创新,使得满足专利的新颖性和创造性规定,并获得专利授权?


通过分析,不难发现,模型训练的创新可以分为两类:


第一类


模型训练的创新在模型结构或输入模型数据的预处理过程上,模型训练过程和模型应用具有相同的创新点技术特征。


在专利布局上,可以以模型应用过程为主布局权利要求,模型训练过程为辅。


(a)若模型训练的创新在模型结构上

此时模型应用过程与模型训练过程有相同的模型结构,无论是在模型训练过程,还是在模型应用过程中,两者都是采用相同的模型结构对数据进行处理,即处理数据的过程是相同的,且该数据处理过程即是创新点。模型训练过程和模型应用过程可以各自独立的描述相应的技术特征,模型训练和模型应用单独布局,且两个独立权利要求中的数据特征互不关联,但数据处理方式类似。


例如:

· 在模型训练的权利要求布局中,描述对图像样本数据的图像特征提取及识别过程,并基于识别结果及标注结果以实现对模型的训练;

· 在模型应用的权利要求布局中,描述对获取的图像数据的图像特征提取及识别过程,直接输出识别结果。


(b)若模型训练的创新在输入模型数据的预处理过程

则模型应用过程与模型训练过程都有相同的预处理过程,可以分别单独布局独立权利要求,且两个独立权利要求中的数据特征互不关联,但具有相同的数据处理方式。


例如:

· 在模型训练前首先对图像样本数据进行采样、滤波处理,然后将处理后的图像样本数据输入模型,得到识别结果,然后根据识别结果及标注结果以对模型进行训练;

· 在模型应用时,首先对获取的图像数据进行采样、滤波处理,然后将处理后的图像数据输入模型,直接输出识别结果。


此外,对于模型应用过程在布局独立权利要求时,可以不用引入模型的概念,仅仅描述对数据处理的过程。


第二类


模型训练的创新在于样本数据不同、模型参数调整和损失函数构建等,这些过程只有在模型训练过程中才会出现,在模型应用中不会出现相应处理过程,即模型训练和模型应用无相同创新点技术特征


这类情况下,模型训练的创新完全体现在模型训练过程中,模型应用过程完全依赖于训练好的模型使用,以实现对数据的处理,得到处理结果。


这时,模型应用的权利要求中需要引入模型训练相关特征来体现创新性,在专利布局过程中,模型训练过程作为主要的权利要求布局


模型应用的权利要求布局方式有两种:

  • 第一种布局方式,模型应用的权利要求中直接引用模型训练的权利要求内容;

  • 第二种布局方式,模型应用的权利要求中不引入模型训练的全部技术特征,仅仅是采用静态限定方式采用突出创新点的技术特征对模型进行限定。


对比两者布局方式,会发现第二种布局方式模型应用的技术特征相对较少,保护范围会更大;第一种布局方式会更简洁,会节省权利要求的数量。


根据上述分析,可以将第一类和第二类两种情况下的专利布局策略总结如表格2所示。

 >>>  四、结 语


人工智能算法应用于具体技术应用或计算机内部性能结合已能够满足专利保护的客体规定,对于涉及人工智能算法模型改进的技术创新,采用合理的专利布局方式能够让技术创新保护的更加全面。


  • 对于模型训练的创新点在于模型结构或输入数据预处理时,专利布局时以模型应用布局为主,模型训练布局为辅,模型应用和模型训练分别布局对应的独立权利要求及从属权利要求,且模型训练过可以进一步布局在模型应用的从属权利要求中;

  • 对于样本数据、模型参数和损失函数的创新点在于专利布局时,以模型训练布局为主,模型应用布局为辅,模型训练和模型应用分别布局对应的独立权利要求及从属权利要求,且在模型应用权利要求中采用静态限定描述方式限定模型采用何种数据或什么损失函数等训练得到,模型应用权利要求的保护范围会相对大一些。


上述从理论角度分析了采用何种方式进行专利布局,而在实际操作中,可以结合具体需求,选择有利的布局方式。

  • 例如,针对样本数据、模型参数和损失函数的创新,为了节省费用,模型应用的独立权利要求可以采用引用模型训练的方式布局。

  • 再如,模型训练改进的技术创新,除了可以布局模型训练和模型应用的权利要求,还可以对模型使用场景进行扩充,布局更细分的应用领域,如识别图像的训练模型,可以采用上述布局策略布局图像识别模型的训练和应用的权利要求,还可以布局交通领域中的图像识别。




Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1