#本文仅代表作者观点,不代表IPRdaily立场,未经作者许可,禁止转载#
来源:IPRdaily中文网(iprdaily.cn)
作者:杜衡 国家知识产权局专利局审协江苏中心副研究员
原标题:由当前智能语义检索的不足思考专利检索的特质
当前智能语义检索的实际效果还远未达到真正人工智能的程度,其原因既有算法设计本身的缺陷,亦有处理对象的复杂性。相较于算法设计的缺陷,处理对象的复杂性是人工智能在专利检索领域更难逾越的鸿沟,但这又何尝不是人不可替代的价值所在呢?
随着计算机技术的发展,人工智能(AI)对于社会各行各业产生了全面而又深远的影响,使信息革命步入了2.0版本的高级阶段。专利检索正是一种信息获取的方式,也紧随潮流出现了智能语义检索。从概念上说,智能语义检索与传统人工操作的计算机检索的本质不同在于:无需人工提取检索要素并输入构建的检索式,而仅需输入目标文件,就能自动获得对比文件。但从实践情况来看,目前智能语义检索的效果仍然差强人意。譬如,国家知识产权局内部使用的S系统,虽然集成了“自动检索”功能,但几乎不能直接提供令人满意的对比文件。而商用专利检索工具,如Patentics,其智能语义检索若不加进一步限定,直接有效命中对比文件的概率也不太高。所以,在使用任何智能语义检索工具时,一般都需要手动添加检索要素以及人工筛选文件,以一种“半自动”的方式满足检索需求。换言之,在专利检索领域,所谓的智能语义检索还远未达到真正意义上的人工智能程度,更无法取代人工检索。审查员无法仅凭智能语义检索“守株待兔”式地获取有效对比文件。大概正因如此,审查员的人均审查任务量并没有随着智能语义检索的出现而成倍激增。
在人工智能机器“阿尔法狗”(AlphaGo)已经能够击败围棋顶级高手的时代,为什么智能语义检索还不及一名初级审查员的检索水平?本文结合实例,从检索方法论的角度,探讨专利检索在人工智能设计上所面临的独特困境,兼论智能语义检索的可能改进方向。
虽然围棋的变化结果理论上有10170种可能,看似是个天文数字;但从另一个角度来看,围棋的规则却十分简单明确:所围区域更多的一方获胜。基于该简明规则,所谓天文数字的变化其实并不需要遍历,每一步可能的落子点并不是剩余空位中的任意一点,而是其中获胜概率较大的位置。AlphaGo的设计者Demis Hassabis正是抓住了这种本质,才以不变应万变,借助网络实战的大数据样本和神经网络算法,删繁就简,实现了计算机的有效自主决策,并能最终取胜。
反观专利文献的检索,判断检索成功的标准却要复杂得多。它并不像围棋那样可以简单通过公开特征数量的多寡,来判定检索结果是否与本发明等效。因此智能语义检索无法明确给出结论,只能给出相似度作为参考,最后仍然需要人工的终极决策。
虽然100%相似度的对比文件可被简单判定为检索成功;但是此类对比文件的获取概率,会随着权利要求篇幅的加长而急剧降低。对于有上百字限定的常规权利要求,除非是本人的相同申请或他人的故意抄袭,否则要找到特征一一对应的对比文件会变得极其困难。
为避免漏检,更全面而实用的规则是:找到能够否定权利要求创造性的对比文件或对比文件组合。该规则相较于上述新颖性规则是较低的标准,优势是不必检索到权利要求中的每个细节,且可以兼容否定新颖性的检索结果;缺点是需要辨识权利要求中各技术特征的重要性,做一番合理的取舍,还需要考虑证据的组合方式。而这些判断都很难量化,这是智能检索的算法设计所面临的瓶颈,也是人工检索中的决策难点。所以在运用具体数据库中的检索技巧之前,首先应当针对个案理清楚两个关键问题:一、本权利要求的组成要素是什么?二、各要素之间结合的紧密度如何?方能删繁就简,有的放矢。
一、权利要求的组成要素
所谓权利要求的组成要素,是对权利要求中各必要技术特征的概括表达。将组成要素从权利要求的连贯表述中剥离出来,主要是为了使检索系统能为本发明有效地适配同类对比文件,同时也能使检索者在不断地检索调整中始终保持清晰的目标。
组合要素的选取是否得当,主要看该要素组合的表达能否使本发明有效地区别于其他同类方案。这好比是广播寻人启事,对于查找对象的特征描述必须要有辨识度,比如性别、身高、年龄、脸型等能够迅速缩小寻找范围的特征,以及某处的胎记、疤痕等独特标志;而无需描述作为同类皆有的特征,如两个眼睛,一个鼻子等。与之类似,提炼权利要求的组成要素,主要从两个方面考虑:一是具体的应用领域,二是声称的对现有技术的改进。
但实际操作中,对于限定较多的权利要求,有效地识别组成要素并非易事。
下面结合实际案例来分析说明。
案例1,一种养猪用料槽(201710070290 .0)
权利要求1:
一种养猪用料槽,包括顶部开口的下料桶(1)、位于下料桶两侧的槽本体(2)、位于下料桶侧壁的出料口(3),所述出料口连通所述槽本体与所述下料桶,所述下料桶为立方体结构,其特征在于:所述槽本体顶部设有翻盖(7),所述下料桶沿长度方向的内壁垂直设有挡板(4)以及与所述挡板相适应的滑槽,所述挡板可沿所述下料桶内壁在所述滑槽内滑动,所述挡板与所述出料口(3)同侧,所述挡板侧壁与所述下料桶顶部接触处设有夹紧件(10),所述下料桶底部设有分料块(6)。
结构附图如下所示:
该技术方案结构简单,表述清晰。分别通过S系统智能辅助检索,Patentics智能语义检索,以及人工检索三种途径进行检索,所得的最接近的现有技术完全不同。
★ S系统智能辅助检索:
相似度判定为99%的最接近现有技术:一种移动式养猪用料斗(CN201623329U),以下简称D1。
主要结构附图:
方案概述:该料斗分为外框架2和内部料斗7,内部料斗7下部呈锥形,方便饲料下落。需要下料时,通过把手9将推拉挡板8向外拉出即可。
★ Patentics智能语义检索:
相似度判定94%的最接近现有技术:一种猪饲料装置(CN204811436U),以下简称D2。
主要结构附图
方案概述:饲料箱204底部依次设有第一闸门208、计量筒208和第二闸门209。通过交替开闭两个闸门,实现每次投喂计量筒208体积内的定量饲料。此外,采用分隔板102等距分隔而形成进食口301。
★ 人工检索:
认定的最接近现有技术:一种多孔料槽(CN20505248U)。以下简称D3。
主要结构附图:
方案概述:在料斗1和料槽2之间设置有挡板3,调节挡板3在导槽4中的上下位置可控制料槽2内的饲料数量,并通过销轴64插在档位槽91中不同高度,实现对挡板的定位调节。料槽2上开设有多孔板22。
通过简单对比,可以得出如下结论。
首先,三份对比文件与本发明均存在不同,均无法单独否定本权利要求的新颖性。具体而言,D1与本发明的差异最大,仅公开了料斗及横向抽拉的挡板8,未公开出料槽等其他特征。D2同样存在较大差异,所公开的两道横向闸门仅与本申请的挡板功能类似,结构并不相同。D3公开了可沿滑槽上下移动的挡板3及相关定位销轴,但挡板的定位方式与本申请不同。
其次,三份对比文件彼此之间有两点共性:一、都属于饲料装置,二、料斗内都设有的挡板(或闸门)。可见在提取权利要求组成要素时,都提取了技术领域“饲料装置”和改进点“挡板”;而未限定权1中“翻盖”、“夹紧件”和“分料块”等其他特征。
对于技术领域要素的表达,可以采用本申请的分类号A01K5/,且没有明显的交叉领域分类号,因此不会对表达造成困扰。
而对于改进点,把什么特征作为要素优先考虑,则要经过一番比较和筛选。智能语义检索的内部算法无从知晓,但从结果可以推断它并未局限于权利要求本身的表达,而是结合了对说明书的记载对权利要求的特征做了筛选,否则不可能将区别如此巨大的对比文件判定为如此之高的相似度。
人工检索时,也依据了说明书记载的技术问题和有益效果确定组成要素。说明书中声称所要解决的技术问题是防止多猪抢食,解决的手段是在槽体内设置薄板加以分隔,因此首先将“分隔板”作为要素之一。但该权利要求书的撰写并不规范。在独立权利要求1中并未记载该特征,而是在从属权利要求6中限定,因此在针对权利要求1的举证文献中该要素并不必要。
继续研读说明书的有益效果提炼权利要求中的改进点要素。本说明书记载的有益效果除了与声称的技术问题相关的“防止抢食”之外,还有另外两个关联度不高的效果:1、出料可控,2、饮水与饲料可分。这两个效果均与挡板有关,因此将“挡板”也列为组成要素。
智能语义检索的D1和D2中的“挡板”结构均是水平横向设置的,与权利要求1中限定的“垂直设有挡板”存在明显差别。且当本权利要求的“出料口”被限定为位于“下料桶侧壁”时,横向挡板并不能直接转用。此外,横向开合的挡板也无需“加紧件”来维持开口,与其结合并无必要。因此用D1或D2单篇否定权利要求1的创造性缺乏说服力。D3公开的倾斜挡板更接近于本发明的垂直挡板,也公开了设置在料斗侧面的出料槽,相较于D1或D2更加接近权利要求1中的结构。但也未公开在料斗两侧分置料槽,因此仍然较难单篇否定权利要求1的创造性。
在此情形下,就需要考虑证据的组合使用。这就涉及到另一个至关重要的问题:能否采用不同证据的组合来评述作为一个整体的权利要求方案。这也是目前智能语义检索的较大缺陷——它只能评估单篇相关文献的相似度,却不能判断是否可以采用多份证据组合评述,更不会推荐证据组合的方式。
而要对证据组合的问题作出比较客观的判断,就需要评估各要素之间结合的紧密度。
二、各要素之间结合的紧密度
笔者曾提出过“技术特征团”的概念【1】,用于分析各技术特征之间结合紧密度的问题。具体而言,所属技术领域的技术人员根据本申请的记载,如果判定某个技术特征必须结合其他技术特征才能共同作用,那么这些技术特征的组合就应当作为一个“技术特征团”考虑,否则可以作为相对独立的技术特征分别考虑。
此概念也同样适用“组成要素”之间结合紧密度的分析。如果权利要求方案中的多个组成要素客观上只能以“要素团”的形式协同作用,那就应当以单篇对比文件举证,而不能采用多篇证据组合。如果多个要素的作用相对独立,那么可用多篇对比文件分别举证。
以大家熟知的剪刀为例,它具有左刃和右刃两个要素,且只有通过两爿刀刃的协同作用才能进行剪切,因此这两个要素具有不可拆分的关联性,共同构成了一个“要素团”。对于该“要素团”,只能举证同时具备左刃和右刃的产品的单篇文献作为对比文件。若采用分别公开单边开刃的切刀的两篇对比文件来组合否定剪刀的方案,则属于“事后诸葛亮”,因为在这两篇对比文件中均不存在最基本的剪切作用。
而对于带有刀刃和刀鞘的水果刀,虽然刀刃和刀鞘同样是高度匹配,但“刀刃”的切割作用不需要依赖“刀鞘”,“刀鞘”的保护作用也不需要借助于“刀刃”。这两个要素之间不存在不可拆分的关联,即不构成“要素团”,因此可以采用不同的对比文件分别举证。
再看上述实际案例。对于双侧料槽这一要素,说明书中声称可以实现将饮水和饲料分开供给的效果。说明书中给出的具体解决方式是使料斗内一侧的挡板关闭出料口,然后在关闭侧的槽体内注入饮水。而在权利要求中的相关特征仅出现在前序部分:位于下料桶两侧的槽本体。并未限定它和挡板的配合方式。
虽然按照说明书的解释,双侧食槽需要和料斗内的挡板配合使用才能实现水和饲料的分装。但从实际的可行性来说,只要设立了两条彼此相对隔离的食槽,就可以从不同的方向分别加装水和饲料,实现分离。因此双侧食槽并不必须通过与挡板配合使用才能实现所述功能。
从另一角度来看,挡板的作用主要是调节料斗内饲料的出料量,也并非只与双侧食槽配合使用,作用相对独立。因此双侧食槽和挡板之间不存在紧密关联,不构成“要素团”,可以分别举证。
针对双侧食槽,检索得到如下对比文件(以下简称D4):一种防拱料供给猪槽(CN203872771U)
主要结构附图:
相关特征为:在供料通道5的两侧分别设置供食槽3。
因此该对比文件D4可与上述D3结合评价本发明。一通采用这组证据结合否定权利要求1的创造性后,本案主撤。
三、小结
当前智能语义检索的实际效果还远未达到真正人工智能的程度,其原因既有算法设计本身的缺陷,亦有处理对象的复杂性。
就算法设计本身而言,首先,根据检索结果推断,目前的智能语义检索主要根据对比文件与本申请之间选定要素的重合度,来评估两者整体的相似度。虽然目前智能检索系统对于要素的提炼能力和表达的扩展能力都相对较强;但以点代面地判断方案之间的整体相似度仍会导致误判。其原因在于,权利要求作为一个整体,要素与非要素之间还存在特定的关联。若只关注要素的相似度,而不再结合相关非要素做整体匹配度的识别调整,那么就会出现本文案例中对D1和D2相似度的误判情形。这两篇对比文件所公开的“挡板”要素本身就与本申请的挡板存在许多细节差异,在与出料口和食槽等非要素的匹配方面,差异就被进一步放大。这导致从最终的直观认知上说,极少会有人认为它们与本发明的相似度可以高达99%或94%,甚至能否破坏本发明的创造性都存在疑问,因此本案的实际审查中并未采用D1或D2作为对比文件。
其次,智能语义检索只能评估单篇文献的相似度,而不评估多篇文献组合后的相似度。这种检索结果只适用于评价新颖性或区别皆为公知的创造性。而对于需要组合证据评价创造性的案例,无法自动提供充分的证据。本文列举的实例亦是如此,采用两篇证据的组合可以否定权利要求1的创造性,得到了申请人的默认。而其中最接近现有技术D3在patentics中判定的相似度仅有74%,D4的相似度为78%,按相似度排序均在前500名之外,基本等同于没有命中。因此,现有智能检索系统需要改进的重点是:根据各要素之间的结合紧密度的判断,对要素进一步做聚合或孤立,进而对是否可以组合举证做出有效判断;若可以组合举证,则给出证据的具体组合方式,并对各组合方式的整体相关度做出有效判断。
就处理对象的复杂性而言,实际发明方案的设计和撰写有着各种难以预料的不规范或者例外,导致创造性的实际判断存在很多的不确定性。就本文所举的实例而言,它的方案本身虽然毫不费解,也没有什么发明高度,但是在声称所要解决的技术问题、撰写的权利要求方案,和声称所能实现的有益效果方面,三者之间多有出入。导致对于把握主旨、提炼要素产生较大的困扰。更确切地说难的不是找到相关的对比文件,而是不易确定要举证到何种程度才算合格。由于实际操作的不确定性,使得专利检索并不像下围棋那样,能完全客观地通过公开特征数量的多寡来判定结果;也难以通过大数据、自学习来使AI有效决策,仍然需要行业专家主观判断的介入。也正因如此,才会使得对于同样的事实和证据,秉持同一套判断规则的实审部门、复审部门及各级法院,可能会判定出截然不同的结果,来回摇摆。而且在美日欧等国家地区,亦是如此。
相较于算法设计的缺陷,处理对象的复杂性是人工智能在专利检索领域更难逾越的鸿沟,但这又何尝不是人不可替代的价值所在呢?
注:
【1】参见 杜衡等:《技术特征团和外延比较法——对修改超范围的判断方法小议》,载《专利法研究》2009年
来源:IPRdaily中文网(iprdaily.cn)
作者:杜衡 国家知识产权局专利局审协江苏中心副研究员
编辑:IPRdaily王颖 校对:IPRdaily纵横君
注:原文链接:由当前智能语义检索的不足思考专利检索的特质(点击标题查看原文)
如有想看文章主题内容,欢迎留言评论~
「关于IPRdaily」
IPRdaily是具有全球影响力的知识产权媒体,致力于连接全球知识产权与科技创新人才。汇聚了来自于中国、美国、欧洲、俄罗斯、以色列、澳大利亚、新加坡、日本、韩国等15个国家和地区的高科技公司及成长型科技企业的管理者及科技研发或知识产权负责人,还有来自政府、律师及代理事务所、研发或服务机构的全球近100万用户(国内70余万+海外近30万),2019年全年全网页面浏览量已经突破过亿次传播。
(英文官网:iprdaily.com 中文官网:iprdaily.cn)
本文来自IPRdaily中文网(iprdaily.cn)并经IPRdaily.cn中文网编辑。转载此文章须经权利人同意,并附上出处与作者信息。文章不代表IPRdaily.cn立场,如若转载,请注明出处:“http://www.iprdaily.cn/”
国家知识产权局确认天丝集团享有红牛金罐商标的合法权益,驳回北京红牛的无效宣告请求
#晨报#无线通讯芯片厂商力同科技创业板IPO获受理,但有“专利无效”风波;《钢铁飞龙之再见奥特曼》侵权案一审判决,圆谷公司胜诉
文章不错,犒劳下辛苦的作者吧