#本文仅代表作者观点,不代表IPRdaily立场,未经作者许可,禁止转载#
“在知识产权领域来说,甚至有人开始尝试让ChatGPT撰写专利文件。那么,ChatGPT是否能应用于专利检索?ChatGPT的检索能力如何?”
来源:IPRdaily中文网(iprdaily.cn)
作者:梁嘉琦 嘉权专利商标事务所软件通讯与电学总监
近日,人工智能技术ChatGPT成为了热门话题,受到了广泛的关注和讨论。其在自然语言处理和文本分析等领域的应用效果备受好评,引起了人们的极大兴趣。ChatGPT(Generative Pre-trained Transformer)是备受瞩目的一项技术。它基于深度学习和自然语言处理技术,可以用来生成自然语言文本、对话、问答等各种语言模型,是目前在语言领域中最先进和高效的技术之一。
ChatGPT的应用范围非常广泛。例如,它可以用于智能客服、虚拟助手、智能问答、机器翻译、摘要生成等多个领域。在医疗、金融、法律、媒体等领域,也可以应用ChatGPT来生成和分析文本数据,从而提高工作效率和准确度。
随着ChatGPT的热潮,人们不断开发对ChatGPT的应用,使ChatGPT被应用在不同的领域。例如,它可以用于智能客服、虚拟助手、智能问答、机器翻译、摘要生成等多个领域。在医疗、金融、法律、媒体等领域,也可以应用ChatGPT来生成和分析文本数据,从而提高工作效率和准确度。在知识产权领域来说,甚至有人开始尝试让ChatGPT撰写专利文件。
另一方面,ChatGPT是否能应用于检索专利文献,我们不禁对此展开思考。传统的专利检索工作需要专利代理师进行人工检索和筛选,而ChatGPT作为一种具有高度自动化的技术,可以自动处理文本数据、提取和分析信息。
我们想象一个场景,如果用户只需要将技术内容或者专利公开号输入到ChatGPT中就能够自动完成专利文献的检索,就不用专门委托专利代理师检索了,这也让一些专利检索从业人员开始感到担忧,他们的工作可能会被ChatGPT取代。
究竟ChatGPT是否能应用于专利检索,以及ChatGPT的检索能力如何。我们对此直接进行了相关的测试。
这是我们准备的检索对象:
图1
如上述图1所示,公开了一种杯子,包括杯体、杯盖和螺旋式吸管,吸管顶端作为吸水口,吸管最下端为进水口,其特征在于,该螺旋式吸管缠绕杯子外壁设置。由于吸管缠绕在杯体的外壁,因此能够起到抗震保护杯体的效果。
针对上述内容,我们直接使用ChatGPT进行检索,看看检索效果如何?在ChatGPT对话框中,我们输入如下语句,并得到ChatGPT的回答。
图2
可以看到,ChatGPT几乎立即就完成了检索,给出了公开号、专利名称和近似的理由,根据ChatGPT输出的内容,好像都找到了与本申请十分接近的专利文献,这是不是证明ChatGPT的确能不费吹灰之力完成专利检索呢?我们对ChatGPT的检索结果进行验证:
图3
通过对ChatGPT给出的结果进行检索,发现和我们要检索的内容毫不相关,那么,为什么ChatGPT会给出这样不靠谱的答案呢?
我们通过了解知道,ChatGPT实质是一个语义应答模型,是不具备实时检索专利数据库功能的,因此其给出的答案可能毫无真实性可言。
这说明ChatGPT的专利检索能力失败呢?我们换一个思路,直接检索不行,用来构建检索式行不行呢?理论上,ChatGPT擅长的是语义识别提取,那么提取文本中的关键信息并自动构建检索式,用户就可以直接在数据库中进行检索,这样也可以取代专利检索从业人员的工作,就这个思路,我们进一步进行操作,让ChatGPT提取技术文本中的特征并自动构建检索式:
图4
可以看出,ChatGPT根据技术效果从技术文本中提取了杯子,螺旋吸管,缠绕以及抗震这些特征构建检索式,看上去还是比较准确,不过这是在有益效果说的比较清楚的情况下,我们输入的技术效果是根据特征推理出来的,也就是说我对技术效果做了一定的加工,在大多数情况下,复制的技术效果都比较笼统,这样ChatGPT的识别就会出现问题,例如:
图5
当技术效果不结合特征进行描述时,ChatGPT是无法准确提取检索要素的。那么,如果连有益效果也不给出,ChatGPT能提取出准确的检索要素吗?
图6
可以看出,如果不限定检索式,则会将技术文本中的所有关键词进行检索式的构建,检索范围太小,导致检索不出专利。对比图4至图6ChatGPT给出的检索式,认为图4的检索式比较符合要求,我们采用字段“标题+摘要+权利要求”验证图4给出的检索式,得到如下结果:
图7
从图7中可以看出,只有9篇检索结果,而且大多是不相关的内容。从上面可以看出,在完成关键词的提取及检索式构建上,目前ChatGPT还不太胜任。也就是说,用户如果不懂检索的原理,不分析技术内容,只是简单把技术文本交给ChatGPT进行检索式的构建,检索结果是有问题的,这样会导致用户认为技术文本是具备创造性的错误结论。
那么,ChatGPT是否能够在专利代理师的配合下很好地完成检索工作呢?我们进一步进行测试,这次,根据ChatGPT的强项,我们先让ChatGPT对技术文本进行关键词的提取:
图8
可见,ChatGPT对技术文本的关键词提取还是十分准确的,分词也是较为合理。这样,专利代理师就可以直接在关键词结果中选择所需要检索的检索要素并让chatgpt构建检索式(即专利代理师参与了基本检索要素的选择),例如:
图9
从结果可以看出,ChatGPT对于关键词的扩展能力是比较优秀的,而且生成的检索式能够直接复制到检索数据库中进行检索,不用再手动输入括号以及逻辑运算符了。我们再对检索式进行验证,得到如下结果。
图10
十分惊喜的是,这次的检索结果比较理想,检索结果都是目标专利。也就是说,专利代理师通过分析技术方案,确定准确的检索要素,再由chatgpt进行关键词扩展和检索式构建,能够在一定程度上提高专利代理师的检索效率,特别是在初检的时候,专利代理师在阅读完技术方案后,在chatgpt的辅助下能较快地得到专利的初检结果,并且能够方便地进一步对检索式进行调整(例如增减关键词、用分类号代替某个检索要素、调整检索字段等等)。
另外,是否能够让ChatGPT自动找分类号呢?我们也进行了测试:
图11
可见,ChatGPT也能够很快地给出分类号,但需要警惕的是,每当ChatGPT输出数字或者号码答案时,一定要对其进行验证,果不其然,分类号都是不准确的。
图12
从图12可知,ChatGPT给出的分类号只是餐桌上的饮水器皿,并非传统意义上的水杯。因此,用ChatGPT进行分类号的提取准确性较低,还不如对图10中的检索结果进行分类号的统计,这样还能更快获得水杯的分类号。
综上所述,ChatGPT并不能自动完成专利检索任务,虽然ChatGPT能够较好地完成关键词的提取,但是ChatGPT不能判断哪些关键词为基本检索要素,而对基本检索要素的把握是专利代理师能够较好完成检索任务的关键,也是专利代理师的核心价值所在,这部分是目前ChatGPT所不能取代的。因此目前的ChatGPT并不会导致专利检索从业人员的失业。
那么是否让ChatGPT成为专利代理师的检索工具,提高检索效率吗?我认为是有限的,一方面,专利代理师的检索战场是在专利数据库中,检索所花费的大部分时间精力在于检索式的调整和文献的浏览,而ChatGPT仅仅提供了一种快速进入“战场”的方法。虽然ChatGPT的关键词扩展能力较优,但是一般的专利数据库中都自带了关键词扩展工具,也能很好地完成关键词扩展的操作,使用ChatGPT进行关键词扩展是只应用上更加方便,并不会为检索质量和效率带来实质性的飞跃。
由于ChatGPT的帐号注册以及运行环境均具有不小的门槛,因此我认为没有必要为了辅助检索而特意使用ChatGPT。如果想尝鲜使用ChatGPT进行检索的朋友,也可以参考上文中我和ChatGPT之间的对话。
当然,随着ChatGPT的迭代更新,未来可能会实现基本检索要素的准确识别,或者在专利文献近似度判断方面能有更好的表现。我们也会密切关注技术进展,并为大家更新相关的资讯以及使用技巧。
(原标题:探索ChatGPT在专利检索中的应用)
来源:IPRdaily中文网(iprdaily.cn)
作者:梁嘉琦 广州嘉权专利商标事务所有限公司
编辑:IPRdaily赵甄 校对:IPRdaily纵横君