#本文仅代表作者观点,不代表IPRdaily立场#
原标题:什么专利?让苹果和他对簿公堂!(附专利维持有效决定书)
2016年11月开始,徐华开始与苹果公司的专利顾问就涉案专利与苹果Siri技术方案异同进行了长时间的沟通,最终未能达成许可合作,随后,徐华正式将苹果公司诉至法院。2018年1月11日,因涉嫌专利侵权,徐华将苹果贸易(上海)有限公司、苹果电脑贸易(上海)有限公司诉至上海知识产权法院,并索赔1万元。2018年2月1日,苹果公司就涉案专利向专利复审委员会提起无效宣告请求。2018年7月23日,专利复审委员会做出判决,维持ZL201310333827.X号发明专利权有效。本文将分享涉案专利的维持有效决定书全文,以供参考交流。
案件概要
涉案专利:“一种语音识别系统和构建方法”(专利号:201310333827X)
徐华于2013年8月4日提交申请,2015年11月18日获得授权。
2016年11月开始,徐华开始与苹果公司的专利顾问就涉案专利与苹果Siri技术方案异同进行了长时间的沟通,最终未能达成许可合作,随后,徐华正式将苹果公司诉至法院。
2018年1月11日,因涉嫌专利侵权,徐华将苹果贸易(上海)有限公司、苹果电脑贸易(上海)有限公司(以下统称为苹果公司)诉至上海知识产权法院,并索赔1万元。
2018年2月1日,苹果公司就涉案专利向专利复审委员会提起无效宣告请求。
2018年7月23日,专利复审委员会做出决定,维持ZL201310333827.X号发明专利权有效。
附:无效宣告请求审查决定书
本无效宣告请求涉及国家知识产权局于2015年11月18日授权公告的ZL201310333827.X、名称为“一种语音识别系统和构建方法”的发明专利(下称本专利),其专利权人为徐华,申请日是2013年08月04日。本专利授权公告时的权利要求书如下:
“1.一种语音识别系统构建方法,所述语音识别系统包括语音识别模块以及注册中心,其特征在于:包括如下步骤,
S01:应用程序提交信息到注册中心;
S02:系统接收用户的语音输入,语音识别模块把语音内容转化为文本形式;
S03:系统验证输入的语音内容是否和根节点的带语义变量的正则表达式匹配,如果匹配就执行相应的函数调用,否则执行下一步;
S04:语音内容被传递给类节点,如果语音内容和所有类节点的带语义变量的正则表达式不匹配,则执行步骤S05,否则执行步骤S07;
S05:语音内容被传递给所有应用程序节点进行语义识别,如果输入的语音内容和所述应用程序节点的正则表达式匹配,系统就执行步骤S07,如果输入的语音内容和所有应用程序节点的正则表达式不匹配就执行步骤S06;
S06:系统丢弃语音内容或者把语音内容输入公共搜索引擎进行大范围的搜索;
S07:系统选择将被调用的应用程序,并把对应于带语义变量的正则表达式的函数调用写入系统为所选应用程序建立的私有目录中;
S08:系统启动所选应用程序,应用程序在加载前会判断应用程序的私有目录中是否有函数和相应的变量,如果存在,应用程序将从私有目录中加载函数和变量,并进行相应函数的调用,否则加载默认初始页;
其中,所述注册中心,用以存储安装在系统中的应用程序信息并建立一个多叉树结构的语音识别系统结构图,其包括:
所述根节点,存储有带语义变量的正则表达式,执行查找和打开存储在系统中的文件或应用程序的操作;
所述类节点,存储了用于描述一系列应用程序共有行为的带语义变量的正则表达式,并把这些正则表达式映射到一个公开函数集中;
所述应用程序节点,属于某个类节点并且继承了所属类节点的公开函数集的应用程序,同时所述应用程序节点还存在一些类节点所没有的带语义变量的正则表达式并映射到特定的函数调用;
应用程序内部节点,存储了应用于应用程序内部的正则表达式以及所对应的函数调用。
2.根据权利要求1所述的语音识别系统的构建方法,其特征在于:步骤S01中提交的信息包括应用程序的名称和标识符,应用程序所归属的类以及应用程序节点和应用程序内部节点特有的带语义变量的正则表达式以及对应的函数调用。
3.根据权利要求1所述的语音识别系统的构建方法,其特征在于:步骤S07中可以根据用户的设置设定属于所述类节点下的所述应用程序节点的优先级,如果和语音内容匹配的类节点的正则表达式没有指定类节点下的某个应用程序节点执行函数调用,优先级高的所述应用程序节点会被选择执行调用。
4.根据权利要求1所述的语音识别系统的构建方法,其特征在于:步骤S07中系统为所选应用程序所建的私有目录,只有所选应用程序和系统可以往私有目录写入数据,同时只有所选的应用程序可以读取保存在私有目录中的函数和变量。
5.根据权利要求1所述的语音识别系统的构建方法,其特征在于:步骤S08中进入应用程序以后,系统处理用户的语音输入包括以下步骤,
S0801:系统接收用户的语音输入,语音识别模块把语音内容转化为文本形式;
S0802:系统验证输入的语音内容是否和应用程序内部节点的正则表达式匹配,如果匹配就执行相应的函数调用,否则执行下一步;
S0803:语音内容被传递给所选的应用程序节点,如果语音内容和应用程序节点的正则表达式匹配就执行相应的函数调用,否则执行下一步;
S0804:语音内容被传递给所选应用程序节点的类节点,如果语音内容和类节点的正则表达式匹配就执行步骤S0810,否则执行下一步;
S0805:语音内容被传递给所选应用程序节点的兄弟节点,如果语音内容和所选应用程序节点的兄弟节点匹配就执行步骤S0810,否则执行下一步;
S0806:语音内容被传递给根节点,系统验证输入的语音内容是否和根节点的带语义变量的正则表达式匹配,如果匹配就执行相应的函数调用,否则执行下一步;
S0807:语音内容被传递给类节点,如果语音内容和所有类节点的带语义变量的正则表达式不匹配,则执行步骤S0808,否则执行步骤S0810;
S0808:语音内容被传递给所有应用程序节点进行语义识别,如果输入的语音内容和所述应用程序节点的正则表达式匹配,系统就执行步骤S0810,如果输入的语音内容和所有应用程序节点的正则表达式不匹配就执行步骤S0809;
S0809:系统丢弃语音内容或者把语音内容输入公共搜索引擎进行大范围的搜索;
S0810:系统选择将被调用的应用程序,并把对应于带语义变量的正则表达式的函数调用写入系统为所选应用程序建立的私有目录中;
S0811:系统启动所选应用程序,应用程序在加载前会判断应用程序的私有目录中是否有函数和相应的变量,如果存在,应用程序将从私有目录中加载函数和变量,并进行相应函数的调用,否则加载默认初始页。”
针对上述专利权,苹果贸易(上海)有限公司(下称请求人)于2018年02月01日向专利复审委员会提出无效宣告请求,其理由是本专利说明书不清楚、公开不充分,不符合专利法第26条第3款的规定;权利要求1-5不清楚、得不到说明书支持,不符合专利法第26条第4款的规定;权利要求1缺少必要技术特征,不符合专利法实施细则第20条第2款的规定;权利要求1修改超范围,不符合专利法第33条的规定;权利要求1-5不具备新颖性,不符合专利法第22条第2款的规定;权利要求1-5不具备创造性,不符合专利法第22条第3款的规定,请求宣告本专利全部无效。
随同其无效宣告请求书,请求人提交了如下附件:
附件1:本专利的授权公告文本;
附件2(下称证据1):申请公布号为CN103049571A的中国发明专利申请,其申请公布日为2013年04月17日;
附件3(下称证据2):申请公布号为CN101847407A的中国发明专利申请,其申请公布日为2010年09月29日;
附件4(下称证据3):专利号为US8239206B1的美国专利文献及其中文译文,其公开日期为2012年08月07日。
结合上述证据,请求人认为:(1)关于说明书不清楚、公开不充分:本专利说明书中对“应用程序”没有使用一致的技术术语、对“函数”和“注册中心”的限定前后不一致,导致说明书不清楚;说明书中缺少具体实施方式,未对“正则表达式”、“多叉树结构”、“节点”、“函数”、“语音识别模块”和“语音识别库”作出完整说明,且说明书不能实现本专利的发明目的,导致说明书公开不充分;(2)关于权利要求1-5不清楚:权利要求1的主题类型、方法步骤、“其包括”、“系统”、“应用程序”、“应用程序”与“系统”之间的关系、“注册中心”与“根节点、类节点、应用程序节点、应用程序内部节点”之间的关系、权利要求1的步骤S01-S08、权利要求1中的“应用程序节点”和“应用程序”的关系、“应用程序内部节点”、“变量”、“语义变量”、“公开函数集”、“特定的函数调用”、“对应的函数调用”不清楚,权利要求2中“应用程序所归属的类”、“特有的带语义变量的正则表达式”和“对应的函数调用”不清楚,权利要求3中“根据用户的设置”不清楚,权利要求4中“私有目录中的变量”不清楚,权利要求5中步骤S0801-S0811均不清楚;(3)关于权利要求1-5得不到说明书的支持:权利要求1中限定的步骤S01-S08得不到说明书支持,权利要求2-5也没有克服上述缺陷,权利要求5中步骤S0807与说明书中的记载不一致,导致权利要求1-5得不到说明书支持;(4)关于权利要求1缺少必要技术特征:权利要求1缺少构建语音识别系统、建立多叉树结构、在S07步骤中如何选择应用程序节点、实现“类节点”、涉及“应用程序信息”、“优先级设置”的必要技术特征;(5)关于权利要求1修改超范围:权利要求1限定的“注册中心”内容与原始公开文本不一致,权利要求1是将原始装置权利要求1、2的产品结构加入原始方法权利要求3中而修改得到的,该合并修改超范围;(6)关于权利要求1-5不具备新颖性:权利要求1-5相对于证据1不具备新颖性;(7)关于权利要求1-5不具备创造性:权利要求1相对于证据1结合公知常识、证据1结合证据2、证据3结合公知常识或证据3结合证据1不具备创造性,从属权利要求2-5的附加技术特征被证据1或证据3公开,因此也不具备创造性。
经形式审查合格,专利复审委员会依法受理了上述无效宣告请求,于2018年02月01日向双方当事人发出无效宣告请求受理通知书,并将无效宣告请求书及其所附附件副本转送给专利权人。
专利复审委员会依法成立合议组,对上述无效宣告请求进行审查。
随后,请求人又于2018年03月01日提交了意见陈述,并补充提交了如下附件(编号续前):
附件5(下称证据4):申请公布号为CN102792320A的中国发明专利申请,其申请公布日为2012年11月21日;
附件6(下称证据5):公开号为US2007/0100790A1的美国专利申请及其中文译文,其公开日为2007年05月03日;
附件7(下称证据6):申请公布号为CN104335234A的中国发明专利申请,其申请日为2013年05月15日,申请公布日为2015年02月04日;
附件8(下称证据7):公开号为US2005/0171779A1的美国专利申请及其中文译为,其公开日为2005年08月04日;
附件9(下称证据8):专利号为US7353176B1的美国专利申请及其中文译文,其专利日为2008年04月01日;
附件10(下称证据9):“基于正则表达式的语音识别控制策略研究”,宋鑫坤等,计算机技术与发展,第20卷第2期,第106-109、113页,2010年02月,复印件共5页;
附件11(下称证据10):《精通正则表达式》,Jeffrey E.F.Friedl著,余晟译,封面页、版权页,第6-10页,2012年07月第1版,复印件共11页;
附件12(下称证据11):“Android安全研究综述”,蒋绍林等,计算机应用与软件,第29卷第10期,第205-210页,2012年10月,复印件共6页;
附件13(下称证据12):“Android移动终端操作系统的安全分析”,孙伟,软件,2013年第34卷第4期,第105-108页,2013年04月30日,复印件共4页;
附件14(下称证据13):《iOS5编程揭秘-iPhone与iPad应用开发入门》,杨正洪等,封面页、版权页、前言、目录页、正文第1-105页、封底页,复印件共121页,2012年11月第2次印刷;
附件15(下称证据14):《iOS
6 Recipes》,Hans-Eric等,Apress,2012年,封面页、版权页、目录页、前言页、正文第1-89页,及其中文版《iOS
6开发范例代码大全》,郑思遥等译,清华大学出版社,版权页、目录页、前言页、正文第1-63页;
附件16(下称证据15):《Unix环境高级编程》,W.Richard Stevens著,尤晋元等译,机械工业出版社,2000年02月,封面页、版权页、目录页,正文第1-90页;
附件17(下称证据16):《talking to siri》,Erica Sadun等,QUE,2013年01月,封面页、版权页、目录页、前言页、正文第1-205页、封底页及其中文译文;
附件18(下称证据17):“无处不在的Google语音控制”,电脑爱好者,2012年09月,第17页;
附件19(下称证据18):“Google在云端”,宁薇,IT经理世界,第365期,2013年06月05日;
附件20:专利权人在侵权诉讼中的权利要求特征对比表;
附件21:本专利的审查历史。
结合上述证据,请求人除了坚持无效宣告请求书中的意见之外,还补充认为:
1、关于说明书公开不充分:本专利中涉及正则表达式、应用程序、函数、注册中心、多叉树结构、语音识别模块、语音识别库的内容公开不充分;
2、关于新颖性:权利要求1、3、5相对于证据1、3、4、5、6、7或8不具备新颖性,权利要求2相对于证据1、3、4、6、7或8不具备新颖性,权利要求4相对于证据1、3、6、7或8不具备新颖性,不符合专利法第22条第2款的规定;
3、关于创造性:分别以证据1、3、4、5、7、8作为最接近的现有技术,权利要求1相对于证据1和证据2或证据9或证据10和/或证据11或证据12或证据13或证据15和/或公知常识的结合,或相对于证据3和证据1或证据5或证据7或证据8和/或证据2或证据9或证据10和/或证据11或证据12或证据13或证据14或证据15和/或公知常识的结合,或相对于证据4和证据1或证据5或证据7或证据8和/或证据2或证据9或证据10和/或证据11或证据12或证据13或证据14或证据15和/或公知常识的结合,或相对于证据5和证据2或证据9或证据10和/或证据11或证据12或证据13或证据14或证据15和/或公知常识的结合,或相对于证据7和证据2或证据9或证据10和/或证据11或证据12或证据13或证据15和/或公知常识的结合,或相对于证据8和证据2或证据9或证据10和/或证据11或证据12或证据13或证据15和/或公知常识的结合不具备创造性;从属权利要求2的附加技术特征被证据1、证据3、证据4、证据6、证据7、证据8、证据13、证据14、或证据15公开,或为本领域的公知常识,从属权利要求3的附加技术特征被证据1、证据3、证据4、证据5、证据6、证据7、证据8、证据13、证据14或证据15公开,或为本领域的公知常识,从属权利要求4的附加技术特征被证据1、证据3、证据6、证据7、证据8、证据11、证据12、证据13、证据14或证据15公开,或为本领域的公知常识,从属权利要求5的附加技术特征被证据1、证据3、证据4、证据5、证据6、证据7或证据8公开,因此也不具备创造性,不符合专利法第22条第3款的规定。
专利权人于2018年03月09日、2018年03月12日和2018年03月13日分别提交了复审无效宣告程序意见陈述书,其在意见陈述中认为本专利符合专利法及专利法实施细则的相关规定。
本案合议组于2018年03月13日向专利权人发出转送文件通知书,将请求人于2018年03月01日提交的意见陈述书及其附件清单所列的证据副本转给了专利权人。
本案合议组于2018年03月16日和2018年03月20日分别向请求人发出转送文件通知书,将专利权人于2018年03月09日、2018年03月12日和2018年03月13日提交的意见陈述书转给了请求人。
本案合议组于2018年03月30日向双方当事人发出口头审理通知书,告知双方当事人本案将于2018年05月17日举行口头审理。
专利权人于2018年04月26日提交了复审无效宣告程序意见陈述书,同时提交了如下附件:
附件A:专利权人于2014年初与无效宣告请求人的电子邮件打印件及其中文译文;
附件B:苹果公司网站siri相关技术文档打印件及其中文译文;
附件C:无效宣告请求人发给专利权人的警告函以及专利权人的回复打印件;
附件D和附件E:苹果公司网站siri相关技术文档录像光盘以及公证书。
专利权人在意见陈述中坚持认为本专利符合专利法和专利法实施细则的相关规定,以附件A至E说明双方当事人之间的纠纷。
本案合议组于2018年05月10日向请求人发出转送文件通知书,将专利权人于2018年04月26日提交的意见陈述书及其所附附件副本转给了请求人。
口头审理如期举行,双方当事人均出席了口头审理。在口头审理过程中,确认记录了如下事项:
(1)口头审理当庭,请求人明确其无效请求的理由和范围:说明书涉及权利要求1-5的部分公开不充分,不符合专利法第26条第3款的规定;权利要求1-5保护范围不清楚、得不到说明书支持,不符合专利法第26条第4款的规定;权利要求1缺少必要技术特征,不符合专利法实施细则第20条第2款的规定;权利要求1修改超范围,不符合专利法第33条的规定;权利要求1-5不具备新颖性,不符合专利法第22条第2款的规定;权利要求1-5不具备创造性,不符合专利法第22条第3款的规定。其中评述新颖性和创造性的证据组合方式与无效宣告请求书及意见陈述书的书面意见相同。
请求人当庭提交了证据10、13、14、15、16的书籍原件,表明其中证据14、16为在亚马逊网站购买,并当庭提交了证据9、11、12、17、18期刊证据的文献复制证明。专利权人对证据1-18的真实性未提出异议。对于请求人所提交的外文证据3、5、7、8、14、16中文译文的准确性,专利权人没有提出异议。专利权人表示2018年04月26日提交的附件仅作为参考,不作为证据使用。
(2)针对具体的无效理由,双方都充分发表了意见。关于说明书公开不充分,请求人认为正则表达式没有充分公开,专利权人则认为带语义变量的正则表达式在说明书中有明确记载。关于权利要求不清楚,请求人强调了权利要求中的“系统”以及应用程序节点和应用程序内部节点之间的关系不清楚,同时,权利要求1步骤S08以后的应用程序的操作没有限定,第三方应用程序无法得知自己所归属的类,无法将注册信息提供给系统;专利权人则认为操作系统和语音识别系统是深度融合的,只有在启动应用程序之后,应用程序内部节点的表达式才可匹配,其函数数量可以相同,也可以不同,同时公开的函数集是系统开发时公开的,用于系统扩展,第三方应用程序在加入系统时根据系统公开的技术文档,可以得知自己所归属的类。关于权利要求得不到说明书的支持,请求人认为权利要求1中的步骤S07如何选择被调用的应用程序是对说明书内容的概括,专利权人则认为除了说明书中的三种方式之外的其他方式也可以实现。关于修改超范围,请求人主张根据审查历史,没有发现在公开文本之前有过修改,可以以公开文本作为原始文本,具体意见同书面意见一致。关于新颖性,请求人重点强调了权利要求1相对于证据4、6、7不具备新颖性,其他意见同书面意见一致。专利权人主要认为证据4、6、7均没有公开类节点以及在类节点调用应用程序函数,其他意见同书面意见一致。
至此,合议组认为本案事实已经清楚,可以依法作出审查决定。
二、决定的理由
1、关于证据
请求人提交的证据1-8为专利文献,证据10、13、14、15、16为书籍证据,请求人当庭提交了其书籍原件,并表明其中证据14、16为在亚马逊网站购买,证据9、11、12、17、18为期刊证据,请求人当庭提交了文献复制证明。专利权人对证据1-18的真实性未提出异议,合议组经审查未发现影响其真实性的明显缺陷,因此证据1-18的真实性可以确认。证据1-5、7-18的公开日期均早于本专利申请日,其可以作为评价本专利是否具备新颖性和创造性的证据使用,证据6的申请日在本专利的申请日之前,公开日在本专利的申请日之后,其可以作为评价本专利是否具备新颖性的证据使用。
专利权人对于请求人所提交的相关外文证据的译文准确性未提出异议,因此证据3、5、7、8、14、16文字部分所公开的内容以请求人提交的中文译文为准。
2、关于专利法第26条第3款
专利法第26条第3款规定:说明书应当对发明或者实用新型作出清楚、完整的说明,以所属技术领域的技术人员能够实现为准。
判定说明书是否充分公开,应该站在本领域技术人员的角度,在本专利所属技术领域结合本领域的知识来理解,而不能只关注个别词句。只要所属技术领域的技术人员根据说明书、说明书附图的记载并结合所属技术领域公知常识,能够实现本专利的技术方案,解决其技术问题、并且产生预期的技术效果,则应当认定本专利说明书对发明作出了清楚、完整的说明。
具体到本案,本专利的目的是提供一种语音识别系统及其构建方法,使得现有的语音识别系统能无缝的应用到用户客户端现有的应用程序的执行上,同时使得语义识别带有更多的个性化特征,能根据用户的偏好,设置被语义识别出的操作的作用域,同时第三方应用程序的语音识别库可以被其他的应用程序发现并且接收来自其他应用程序的操作请求。为解决上述技术问题,本专利采用的技术方案为:
一种语音识别系统构建方法,所述语音识别系统包括语音识别模块以及注册中心,其特征在于:包括如下步骤,
S01:应用程序提交信息到注册中心;
S02:系统接收用户的语音输入,语音识别模块把语音内容转化为文本形式;
S03:系统验证输入的语音内容是否和根节点的带语义变量的正则表达式匹配,如果匹配就执行相应的函数调用,否则执行下一步;
S04:语音内容被传递给类节点,如果语音内容和所有类节点的带语义变量的正则表达式不匹配,则执行步骤S05,否则执行步骤S07;
S05:语音内容被传递给所有应用程序节点进行语义识别,如果输入的语音内容和所述应用程序节点的正则表达式匹配,系统就执行步骤S07,如果输入的语音内容和所有应用程序节点的正则表达式不匹配就执行步骤S06;
S06:系统丢弃语音内容或者把语音内容输入公共搜索引擎进行大范围的搜索;
S07:系统选择将被调用的应用程序,并把对应于带语义变量的正则表达式的函数调用写入系统为所选应用程序建立的私有目录中;
S08:系统启动所选应用程序,应用程序在加载前会判断应用程序的私有目录中是否有函数和相应的变量,如果存在,应用程序将从私有目录中加载函数和变量,并进行相应函数的调用,否则加载默认初始页;
其中,所述注册中心,用以存储安装在系统中的应用程序信息并建立一个多叉树结构的语音识别系统结构图,其包括:
所述根节点,存储有带语义变量的正则表达式,执行查找和打开存储在系统中的文件或应用程序的操作;
所述类节点,存储了用于描述一系列应用程序共有行为的带语义变量的正则表达式,并把这些正则表达式映射到一个公开函数集中;
所述应用程序节点,属于某个类节点并且继承了所属类节点的公开函数集的应用程序,同时所述应用程序节点还存在一些类节点所没有的带语义变量的正则表达式并映射到特定的函数调用;
应用程序内部节点,存储了应用于应用程序内部的正则表达式以及所对应的函数调用。
在本专利中,说明书第[0045]-[0052]段给出了本专利技术方案相关的实施例,并对权利要求1-5中相关的技术特征给予了详细说明,是实现本专利的优选具体实施方式。说明书第[0053]段及图3则进一步举例有关购物类应用程序如何通过购物类查询价格的正则表达式进行函数调用的过程,是本专利具体实施方式的应用例。
其中,关于“应用程序”和“函数”:本专利说明书中所涉及的技术术语“应用程序”和“函数”,是本领域普通技术人员所周知的技术常识,说明书中通过对“应用程序”和“函数”添加相关定语来区分不同的应用程序和函数,其限定是清楚的,并不会造成本领域普通技术人员无法理解;
关于“注册中心”:根据说明书[0006]段的记载,本专利的语音识别系统可以包括:根节点、类节点、应用程序节点、应用程序内部节点及注册中心;而根据说明书[0045]段的记载,本专利的语音识别系统具有注册中心,注册中心可以包括:根节点、类节点、应用程序节点及应用程序内部节点。对于系统结构性描述而言,说明书[0006]段的记载并没有限定根节点、类节点、应用程序节点及应用程序内部节点与注册中心之间的结构关系,而说明书[0045]段的记载则进一步说明了根节点、类节点、应用程序节点及应用程序内部节点与注册中心之间的结构关系,两者并不矛盾。此外,本领域普通技术人员能够理解,通过根节点、类节点、应用程序节点、应用程序内部节点的信息结构特征来限定注册中心的信息结构,并不脱离本专利的语音识别系统所具有根节点、类节点、应用程序节点、应用程序内部节点及注册中心的限定描述,因此该技术特征的表述是清楚的;
关于“正则表达式”:正则表达式是对字符串操作的一种逻辑公式,用事先定义好的一些特定字符及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑,其含义和实现形式对本领域技术人员而言均为公知的。本专利说明书中对正则表达式以及正则表达式与函数的关系均作出了清楚的限定,而编写正则表达式的技术手段是本领域技术人员根据程序编写语言的不同可以任意选择的,解析过程则根据具体的解析需求由本领域技术人员自定义。本专利已通过正则表达式的定义、正则表达式与语音内容的匹配、系统将表达式对应函数调用写入私有目录以及加载调用函数的过程,对“如何将带语义变量的正则表达式匹配到相应函数”这一内容进行了限定,清楚、完整地描述了“正则表达式”的相关技术特征,并公开了根据正则表达式执行相应函数指令的过程;
关于“多叉树结构”和“节点”:本专利说明书第[0045]-[0052]段已经对多叉树的结构进行了描述,而“节点”用于存储对应的正则表达式,因此,本专利中关于“正则表达式”、“节点”和“多叉树结构”的相关技术特征的记载都是清楚、完整的;
关于“语音识别模块”和“语义识别库”:根据说明书第[0045]-[0052]段的记载,语音识别模块即为把语音内容转化为文本形式的模块单元,本领域技术人员理解如何配置语音识别模块将语音内容转换为文本形式;至于本专利所涉及的语义识别库,本领域技术人员能够理解本专利所涉及的表达式具有语义变量且可通过语音内容的匹配来识别语音内容中的语义含义,因此语义识别库只是本专利所涉及带语义变量表达式的一种技术效果描述,本专利中对语音识别模块和语义识别库的描述都是清楚、完整的。
综上,根据本专利说明书的记载,本领域技术人员能够理解,本专利通过需要应用语音操作的应用程序向注册中心提交的信息完成语音识别系统的语音识别模块的构建;通过基于多叉树结构的语义识别模块的构建,使得系统能很快定位所需的应用程序的位置,并使得第三方应用程序很容易就能加入现有的语音识别系统中;通过带语义变量的正则表达式来完成对输入语音内容的语义识别,并通过把更多的语言表达方式所对应的正则表达式映射到同一函数调用的方式使得系统能识别更加人性化的语音内容;通过将应用程序的函数和变量写入应用程序私有目录的方式,使得应用程序在语音识别系统进行语义识别时不占用系统的线程,从而提升了整个系统的性能,同时防止用户输入的语音内容被别的线程窃听到。可见,本专利说明书对发明作出了清楚、完整的说明,符合专利法第26条第3款的规定。对于请求人提出的本专利说明书多处内容不清楚、公开不充分的意见,合议组不予支持。
3、关于专利法第26条第4款有关不清楚的规定
专利法第26条第4款规定:权利要求书应当以说明书为依据,清楚、简要地限定要求专利保护的范围。
3.1关于权利要求1是否清楚
权利要求1的主题名称为一种语音识别系统构建方法,其限定了权利要求1为一种方法类型权利要求,其主题名称的类型是清楚的。权利要求1的特征部分通过方法步骤S01-S08以及注册中心多叉树的结构限定了语音识别系统对语音的处理流程,结合本领域技术人员所掌握的知识,本领域技术人员能够清楚该语音识别系统的架构以及如何构建具有该种架构的语音识别系统。
具体的,语音识别系统包括语音识别模块以及注册中心,其中语音识别模块用于将语音内容转化为文本形式,注册中心用以存储安装在系统中的应用程序信息并建立一个多叉树结构的语音识别系统结构图,多叉树由根节点、类节点、应用程序节点和应用程序内部节点构成,本领域技术人员据此可以理解,语音识别系统构建步骤需要先具备注册中心,建立如注册中心定义的多叉树结构,才能进一步对语音内容进行匹配并执行相应的函数调用。首先,权利要求1中注册中心及根节点、类节点、应用程序节点和应用程序内部节点等特征限定出了多叉树结构的具体形式,其中注册中心由根节点、类节点、应用程序节点和应用程序内部节点构成,每个节点各自具有带有语义变量的正则表达式,以及与正则表达式对应的函数调用。根节点存储有带语义变量的正则表达式,该正则表达式对应的操作主要是用于查找或打开存储在系统中的文件或应用程序。类节点存储有用于描述一系列应用程序共有行为带语义变量的正则表达式,用于描述一系列应用程序共有行为的这些正则表达式被映射到一个公开函数集中。应用程序节点,属于某个类节点并继承了所属类节点的公开函数集的应用程序,不仅如此,该应用程序节点还具有类节点所没有的带语义变量的正则表达式,这些表达式映射到对应的函数调用,应用程序节点代表的是存储相关表达式的结构。应用程序内部节点存储了应用于应用程序内部的正则表达式以及所对应的函数调用,应用于应用程序内部的正则表达式在进入应用程序时才能被运用,应用程序内部节点是多叉树结构的组成部分。由上述内容可知,权利要求1清楚地定义了多叉树的结构。
其次,步骤S01-S08限定了语音识别系统对语音的处理流程。步骤S01:应用程序提交信息到注册中心,本领域技术人员可以理解所述信息即为应用程序提交给系统以用于将应用程序安装在系统中所需的信息;步骤S02:系统接收用户的语音输入,语音识别模块把语音内容转化为文本形式;而步骤S03-S08是在步骤S02的基础上对语音内容进行进一步分析匹配,本领域技术人员可以理解S03-S08中所涉及的语音内容为步骤S02中已经转化为文本形式的语音内容。步骤S03-S05中,分别将语音内容与根节点、类节点和应用程序节点的正则表达式进行匹配,其中正则表达式的含义和实现形式对本领域技术人员而言均为公知的。根据对注册中心多叉树结构的限定可知,根节点的正则表达式对应的操作主要是用于查找或打开存储在系统中的文件或应用程序,因此,若在步骤S03与根节点的正则表达式匹配时,则执行相应的函数调用,即查找或打开存储在系统中的文件或应用程序。类节点的正则表达式对应了应用程序的公开函数集,而应用程序节点的正则表达式继承了所属类节点的公开函数集以及类节点所没有的函数集,因此在步骤S04和S05查找到匹配的正则表达式后,均进入步骤S07对具体应用程序的调用,系统选择将被调用的应用程序的过程即是把对应于带语义变量的正则表达式的函数调用写入系统为所选应用程序建立的私有目录中的过程。步骤S08进一步限定了启动所选应用程序并进行相应的函数调用,系统在启动应用程序时,会判断应用程序的私有目录中是否有函数和相应的变量,如果存在,应用程序将从私有目录中加载函数和相应的变量,并进行相应的函数调用,相应函数指的是对应于私有目录中函数和相应变量的函数,本领域技术人员也可以理解默认初始页的设置和加载是本领域的常规技术手段。在步骤S03-S05均没有查找到与语音内容匹配的正则表达式后,进入步骤S06丢弃语音内容或者把语音内容输入公共搜索引擎进行大范围的搜索,而本领域技术人员可以理解,公共搜索引擎可以是外部所有,也可以是本系统的一部分,其仅需实现对文本形式的语音内容进行搜索的功能即可。由上述内容可知,权利要求1清楚地限定了语音识别系统对语音的处理流程。
请求人在口审当庭特别强调了权利要求1中的“系统”不清楚,以及应用程序无法得知需要提交何种信息到注册中心,造成权利要求1不清楚。
对此,合议组认为:本领域技术人员能够理解,操作系统与语音识别系统是深度融合的,应用程序与语音识别系统均安装在操作系统中,而语音识别系统可以实现对应用程序的调用。本专利权利要求1中语音识别系统具有多叉树的结构,多叉树的节点对应了相应的应用程序的调用,即能够被语音识别系统调用的应用程序均对应于语音识别系统多叉树结构中的某一个节点,因此本领域技术人员能够清楚地区分权利要求1中提到不同系统时所指代的是操作系统还是语音识别系统。对于应用程序提交信息到注册中心,本领域技术人员能够理解,应用程序在被语音识别系统调用时,需要对应于语音识别系统多叉树中的某一个节点,而应用程序与节点的对应关系则需要在安装应用程序时确定。第三方应用程序在加入系统时,根据系统公开的技术文档,即可得知自己所归属的类,因此,本领域技术人员能够清楚地知晓应用程序需要提交何种信息至注册中心。
综上,对本领域技术人员而言,权利要求1的主题类型及保护范围均是清楚的。
3.2关于权利要求2-5是否清楚
权利要求2引用权利要求1,其进一步限定了权利要求1步骤S01中应用程序提交给注册中心的具体信息。根据权利要求1的记载可知,应用程序提交信息到注册中心,注册中心存储应用程序信息,并建立多叉树结构,多叉树结构由根节点、类节点、应用程序节点、应用程序内部节点构成,因此,权利要求2的附加技术特征进一步限定有关应用程序提交信息包含有关应用程序所归属的类、应用程序节点和应用程序内部节点中与应用程序有关正则表达式及表达式对应的函数,对本领域技术人员而言是清楚的。
权利要求3引用权利要求1,其进一步限定了权利要求1步骤S07中调用应用程序的具体方式。由于设定属于所述类节点下的所述应用程序节点的优先级是根据用户设置的,因此设置时间是任意的。本领域技术人员理解如何设置节点优先级,该技术特征也定义了设置优先级后,优先级高的所述应用程序节点会被先选择执行调用,权利要求3的保护范围对本领域技术人员而言也是清楚的。
权利要求4引用权利要求1,其对私有目录作了进一步限定。本领域技术人员可以理解,应用程序的私有目录中可有函数和相应的变量以进行函数调用,其中,变量是函数调用中所涉及的变量,函数则是函数调用所对应的函数。
权利要求5是对步骤S08中进入应用程序之后的步骤的进一步限定,其限定了进入应用程序之后,如何遍历多叉树结构以调用相应函数的过程。其与权利要求1中的步骤S01-S07是不同的过程,同时本领域技术人员也能够理解多叉树中各节点的位置关系及其遍历过程。
综上,本专利权利要求1-5的主题类型及保护范围均是清楚的,符合专利法第26条第4款有关清楚的规定。对于请求人提出的本专利权利要求1-5中多处内容不清楚的意见,合议组不予支持。
4、关于专利法第26条第4款有关不支持的规定
在本专利中,说明书第[0045]-[0052]段给出了本专利技术方案相关的实施例,并对权利要求1-5中相关的技术特征给予了详细说明,是实现本专利的优选具体实施方式;说明书第[0053]段及图3则进一步举例有关购物类应用程序如何通过购物类查询价格的正则表达式进行函数调用的过程,是本专利具体实施方式的应用例。本专利说明书已经详细记载了有关权利要求1-5所记载的技术方案的技术内容及具体实施方式,并能够支持权利要求1-5所限定的技术范围。
请求人认为:本专利说明书中记载了三种基于类节点的匹配、选择类节点下的应用程序节点的方式,而权利要求1中步骤S07“系统选择将被调用的应用程序”概括了一个较大的保护范围,得不到说明书的支持。
对此,合议组认为:权利要求通常由说明书记载的一个或者多个实施方式或实施例概括而成。权利要求的概括应当不超出说明书公开的范围。如果所属技术领域的技术人员可以合理预测说明书给出的实施方式的所有等同替代方式或明显变型方式都具备相同的性能或用途,则应当允许申请人将权利要求的保护范围概括至覆盖其所有的等同替代或明显变型的方式。对于本案,虽然说明书中仅给出了三种基于类节点的匹配、选择类节点下的应用程序节点的方式,但本领域技术人员能够知晓除了说明书中的三种方式之外的其它方式也可以实现,例如按照应用程序的名称或默认设置选择应用程序等,因此,权利要求1中步骤S07“系统选择将被调用的应用程序”是对说明书公开内容的合理概括,能够得到说明书的支持。
请求人还认为:根据说明书的记载,在启动应用程序后对多叉树的遍历过程中,在由根节点往下遍历的过程中,语音内容不会被传递给所在应用程序内部节点的类节点进行解析,而权利要求5步骤S0807限定了“如果语音内容和所有类节点的带语义变量的正则表达式不匹配”,包括了语音内容所在应用程序内部节点的类节点和其他类节点。因此权利要求5概括的技术方案与说明书的记载不一致,得不到说明书的支持。
对此,合议组认为:在判断权利要求是否得到说明书的支持时,应当考虑说明书的全部内容,而不是仅限于具体实施方式部分的内容。如果说明书的其他部分也记载了有关具体实施方式或实施例的内容,从说明书的全部内容来看,能说明权利要求的概括是适当的,则应当认为权利要求得到说明书的支持。具体到本案,权利要求5步骤S0807限定了“如果语音内容和所有类节点的带语义变量的正则表达式不匹配”,包括了语音内容所在应用程序内部节点的类节点和其他类节点。虽然说明书具体实施方式部分第[0052]段记载了“之后的步骤与前面的情形相同,只是语音内容不会被传递给所在应用程序内部节点的类节点进行解析”,即在由根节点往下遍历的过程中,语音内容不会被传递给所在应用程序内部节点的类节点进行解析,但说明书发明内容部分第[0033]段同样记载了“S0807:语音内容被传递给类节点,如果语音内容和所有类节点的带语义变量的正则表达式不匹配,则执行步骤S0808”,即说明书中已经记载了在由根节点往下遍历的过程中,语音内容传递给包括所在应用程序内部节点的类节点和其他类节点的所有类节点。同时,本领域技术人员可以理解,权利要求5限定了进入应用程序之后如何遍历多叉树结构以调用相应函数的过程,其目的是对整个多叉树进行遍历以查询与语音内容匹配的正则表达式,说明书第[0052]段记载的在由根节点往下遍历的过程中,语音内容不会被传递给所在应用程序内部节点的类节点进行解析的方式仅仅为一种优选实施方式,而在由根节点往下遍历的过程中,可以将语音内容传递给所有的类节点进行匹配,也可以为了节约程序,在该步骤排除之前已经查询过的所在应用程序内部节点的类节点,这两种方式均为本领域技术人员在遍历多叉树时的常规选择,其均可以达到遍历整个多叉树的技术效果,本领域技术人员在整体阅读本专利说明书的基础上,能够认知到本专利说明书涵盖了这两种实现方式。因此,权利要求5的技术方案能够从说明书公开的内容中概括得出,能够得到说明书的支持。
综上,本专利权利要求1-5能够得到说明书的支持,符合专利法第26条第4款的规定。
5、关于专利法实施细则第20条第2款的规定
专利法实施细则第20条第2款规定:独立权利要求应当从整体上反映发明或者实用新型的技术方案,记载解决技术问题的必要技术特征。
根据说明书第[0004]段的记载,本发明的目的是提供一种语音识别系统及其构建方法,使得现有的语音识别系统能无缝的应用到用户客户端现有的应用程序的执行上,同时使得语义识别带有更多的个性化特征,能根据用户的偏好,设置被语义识别出的操作的作用域,同时第三方应用程序的语音识别库可以被其他的应用程序发现并且接收来自其他应用程序的操作请求。权利要求1保护了一种语音识别系统构建方法,其通过限定语音识别模块及注册中心的具体技术特征来构建语音识别系统,并通过语音识别系统执行的特定流程步骤以完成系统构建,因此权利要求1具备了构建语音识别系统的必要技术特征。
具体地,权利要求1中有关根节点、类节点、应用程序节点和应用程序内部节点的特征记载了多叉树结构的必要技术特征,即通过根节点、类节点、应用程序节点、应用程序内部节点构成多叉树结构,并清楚的记载了如何通过上述节点构成多叉树结构;权利要求1中记载了“系统选择将被调用的应用程序,并把对应于带语义变量的正则表达式的函数调用写入系统为所选应用程序建立的私有目录中”的技术特征,其中通过步骤S04或S05的匹配过程已明确了步骤S07中对应带语义变量的正则表达式,由于对于S04及S05中的类节点和应用程序节点而言,其存储的每个正则表达式都与应用程序具有对应关系,当步骤S07中的正则表达式可以确定,那么正则表达式的确定就是该应用程序的选择,“把对应于带语义变量的正则表达式的函数写入系统为所选应用程序建立的私有目录中”是“系统选择将被调用的应用程序”的具体化执行过程,权利要求1具备如何选择应用程序的必要技术特征;权利要求1记载了有关类节点的技术特征“存储了用于描述一系列应用程序共有行为的带语义变量的正则表达式,并把这些正则表达式映射到一个公开函数集中”,类节点是存储了用于描述一系列应用程序共有行为的带语义变量的正则表达式的结构,类节点的正则表达式映射到一个公开函数集中,权利要求1具备实现类节点的必要技术特征。
综上,权利要求1通过需要应用语音操作的应用程序向注册中心提交的信息完成语音识别系统的语义识别模块的构建。通过基于多叉树结构的语音识别模块的构建,使得系统能很快定位所需的应用程序所在的位置,并使得第三方应用程序很容易就能加入现有的语音识别系统中。通过带语义变量的正则表达式来完成对输入语音内容的语义识别,并通过把更多的语言表达方式所对应的正则表达式映射到同一函数调用的方式使得系统能识别更加人性化的语音内容。通过把应用程序的函数和变量写入应用程序私有目录的方式,使得应用程序在语音识别系进行语义识别时不占用系统的线程,从而提升了整个系统的性能,同时防止用户输入的语音内容被别的线程窃听到。
可见,本专利权利要求1已经记载了解决本专利技术问题所必不可少的技术特征,构成了完整的技术方案,符合专利法实施细则第20条第2款的规定。
6、关于专利法第33条的规定
专利法第33条规定:申请人可以对其专利申请文件进行修改,但是,对发明和实用新型专利申请文件的修改不得超出原说明书和权利要求书记载的范围。
请求人认为:根据公开文本中权利要求1的记载,“注册中心”并不包含:根节点、类节点、应用程序节点、应用程序内部节点。相反,是语音识别系统包括:根节点、类节点、应用程序节点、应用程序内部节点。而授权文本的权利要求1所限定的“注册中心”包含根节点、类节点、应用程序节点、应用程序内部节点,因此,授权文本的权利要求1所限定的“注册中心”的结构关系与原始公开文本不一致,且不能从原始公开文本直接、毫无疑义的得到。此外,本专利授权文本的权利要求1是基于原始权利要求1-3的合并而得到的技术方案,其无法从原始公开内容中直接、毫无疑义的得到。
对此,合议组认为:经审查,本专利公开文本的内容与原始申请文本内容一致,因此其公开文本能够作为判断修改是否超范围的依据。首先,本专利原说明书第[0022]段明确记载了“注册中心是由根节点、类节点、应用程序节点和应用程序内部节点构成的多叉树”,因此修改后权利要求1对注册中心的限定在原始文本中有记载;其次,本专利在实质审查过程中,专利权人依据原说明书第[0022]段和第[0007]段以及原权利要求1和2的记载,将有关注册中心的结构特征以及应用程序节点的特征添加至原权利要求3的构建方法中,以形成授权文本的权利要求1,并相应的删除了原权利要求1-2,由于构建方法时需要知晓注册中心的结构以及多叉树各节点的作用,因此修改后权利要求1的技术方案与原说明书中记载的方案是一致的。由此可见,本专利授权文本的权利要求1没有修改超范围的问题,符合专利法第33条的规定。
7、关于专利法第22条第2款
专利法第22条第2款规定:新颖性,是指该发明或者实用新型不属于现有技术;也没有任何单位或者个人就同样的发明或者实用新型在申请日以前向国务院专利行政部门提出过申请,并记载在申请日以后公布的专利申请文件或者公告的专利文件中。
具体到本案:权利要求1要求保护一种语音识别系统构建方法。
7.1 与证据1相比
证据1公开了一种基于语音识别的索引菜单的方法,并具体公开了以下内容(参见证据1说明书第[0039]-[0099]段及附图1-5):S101、启动语音识别引擎服务;S102、接收用户语音,并根据接收的语音遍历体感动作特征库,获取与接收的语音相匹配的语音特征文件,通过语音特征文件将接收的语音转译成文本字符;S103、通过预设的索引菜单映射表查找到上述文本字符对应的菜单项;S104、调用菜单项对应的接口函数执行菜单操作。菜单的逻辑结构为树状结构,从树状结构的根节点到叶节点,每一个层级对应一级索引,每一级索引对应一个索引菜单映射表,每一个节点对应一个菜单项。下一级子节点索引菜单的操作取决于上一级父节点索引菜单的作用域范围。根索引映射为待机的菜单操作,一级索引映射为从待机进入某个功能界面的菜单操作,其数据结构包括:一级索引菜单名称、应用ID和应用名称、参数信息;二级索引映射为某个应用内部的菜单操作或者启动/返回其他非待机应用的操作,其数据结构包括:二级索引菜单名称、应用ID、应用动作和参数信息;低级别索引对应更细化的菜单操作任务。其中,参数信息用于在同一类别的菜单操作命令中区分不同的执行方式或状态,参数默认为0,即默认的启动方式。为了保证简单易用性,索引菜单映射表的建立可包含预设应用和第三方应用两种方式。两种方式的索引菜单映射表是互相独立的,其中:预设应用的方式可以定义多级的索引菜单操作;第三方应用的方式只能定义一级索引菜单操作,其索引菜单映射表在第三方应用程序安装和卸载时进行配置管理。
根据上述内容,合议组认为:权利要求1与证据1公开的技术方案相比,存在如下区别:
(1)、本专利权利要求1的注册中心与证据1的索引菜单映射表不同。
请求人认为:证据1中的多叉树结构的索引菜单,对应于权利要求1中的“注册中心”。
对此,合议组认为:本专利权利要求1中,注册中心包括:根节点、类节点、应用程序节点以及应用程序内部节点,各个节点存储有对应正则表达式,并实现对应函数调用;注册中心内的正则表达式包括:带语义变量且对应执行查找和打开存储在系统中的文件或应用程序的操作的正则表达式、用于描述一系列应用程序共有行为的带语义变量且映射到一个公开函数集中的正则表达式、类节点所没有的且映射到特定的函数调用的带语义变量的正则表达式、以及用于应用程序内部的正则表达式,注册中心各节点中存储的是应用于应用程序的表达式;不仅如此,注册中心中各节点存储的正则表达式与应用程序的相关函数具有映射关系,其中类节点的正则表达式因具有共有行为的描述而映射至同一公开函数集,其函数映射关系是同一类节点中表达式与这一公开函数集的映射关系。而证据1中,索引菜单映射表为树状结构,节点中对应的是菜单项,并且下级菜单的操作取决于上级菜单的作用域,从树状结构的根节点到叶节点,根索引映射为待机的菜单操作,一级索引映射为从待机进入某个功能界面的菜单操作,二级索引映射为某个应用内部的菜单操作或者启动/返回其他非待机应用的操作,低级别索引对应更细化的菜单操作任务。且针对第三方应用程序,其索引菜单映射表只具有一级索引映射操作,没有下级索引菜单的配置。由上述内容可知,本专利中的注册中心与证据1中的索引菜单映射表从存储的信息、数据结构以及存储信息所对应的函数操作上都是不同的。请求人认为,证据1中有关“同一类别的菜单操作具有相同的命令函数”对应了权利要求1中类节点的“公开函数集”,对此,合议组认为,证据1中的“同一类别的菜单操作具有相同的命令函数”指的并非是表达式与函数集之间的映射关系,而是根据类似或相同的菜单操作自定义设定相同命令函数的技术手段,目的是为了说明如何通过自定义手段设置证据1中菜单项对应的接口函数,并不涉及本专利中类节点所具有的将描述一系列应用程序共有行为正则表达式映射至一公开函数集的技术特征。因此,本专利权利要求1的注册中心与证据1的索引菜单映射表不同。
(2)、权利要求1中有关正则表达式的结构设置与证据1中有关菜单项的设置不同。
基于本专利权利要求1的记载,各节点正则表达式都与特定应用程序对应并指向相应函数,在类节点及应用程序节点的正则表达式与输入语音内容匹配时,正则表达式对应的函数调用会被写入该应用程序的私有目录,应用程序会启动并进行相应函数调用而非加载默认初始页,通过上述数据关系,可实现针对各种语音内容,直接基于被匹配的正则表达式启动应用程序并让应用程序执行相应的函数调用。证据1仅记载了菜单项与菜单操作的对应关系或者菜单项与应用的关系,只有在一级菜单项与应用名称匹配时,才会进入该应用程序中识别子菜单,并进入该应用程序的菜单项,并不能直接针对二级菜单或更低级别菜单操作内容,因此不能直接启动并执行应用程序的操作。权利要求1中有关正则表达式的结构设置也与证据1中有关菜单项的设置是不同的技术手段,因此由正则表达式所组成的根节点、类节点、应用程序节点及应用程序内部节点与菜单项构成的索引菜单也非相同技术特征。
(3)、权利要求1中建立应用程序的私有目录与证据1中索引菜单映射表的数据结构是不同的技术手段。
权利要求1中,私有目录是系统为应用程序建立的,即每个应用程序都具有私有目录,在执行步骤S07时,系统选择将被调用的应用程序时会把对应于带语义变量的正则表达式的函数调用写入应用程序对应的私有目录,以便在执行S08时从私有目录加载函数和相应变量以进行相应函数的调用。私有目录的设置目的是为了让系统在启动应用程序时根据私有目录中是否存储有关函数及变量以优先进行程序的函数调用。
而在证据1中,索引菜单映射表的数据结构只是包括父级菜单项与应用程序的映射关系,以及子级菜单项与应用程序操作的映射关系,其主要目的是为了通过索引菜单映射表中菜单项与语音内容的匹配,执行菜单项对应的函数接口操作,与私有目录的设置目的不同,此外,证据1中在根索引映射为待机的菜单操作,一级索引映射为从待机进入某个功能界面的菜单操作,二级索引映射为某个应用内部的菜单操作或者启动/返回其他非待机应用的操作,低级别索引对应更细化的菜单操作任务。证据1基于索引映射表以及设定了有关应用的执行顺序,是根据根索引映射、一级索引映射、二级索引映射…的执行顺序来的,下级索引映射在上级索引菜单项无法匹配的前提下无法执行函数接口的调用,不能任意根据匹配的菜单项执行函数操作。因此,权利要求1中私有目录的建立与证据1中索引菜单映射表的设置是两个完全不同的技术手段。
(4)、权利要求1中语音内容与正则表达式匹配后的执行过程与证据1中语音内容与菜单项匹配后的执行过程不同。
权利要求1中,语音内容与类节点或应用程序节点的表达式匹配后,正则表达式对应的函数调用会被写入系统为表达式对应应用程序建立的私有目录,应用程序在启动后从私有目录加载函数和变量以进行相应函数调用,否则加载默认初始页。节点中正则表达式的匹配是独立于其他正则表达式的匹配的,可根据上述正则表达式对应应用程序及函数映射的不同,启动不同的应用程序函数调用。
而在证据1中,语音内容需要首先与根索引菜单项匹配,然后执行对应操作,然后语音内容需要与一级索引菜单项匹配,然后执行对应操作,接着语音内容需要与二级索引菜单项匹配,然后执行对应操作,下一级子节点索引菜单的操作取决于上一级父节点索引菜单的作用域范围,在同一级父索引菜单下,其启动的函数操作仅是针对同一应用程序,且不经过上级索引菜单的匹配及函数接口执行,下级索引菜单无法直接执行函数操作。因此,权利要求1中语音内容与正则表达式匹配后的执行过程与证据1中语音内容与菜单项匹配后的执行过程是完全不同的技术手段。
基于上述分析可知,证据1与本专利权利要求1之间存在实质区别,两者不属于相同的技术方案,实现的技术效果也不同,因此权利要求1相对于证据1具备专利法第22条第2款所规定的新颖性。
7.2 与证据3相比
证据3公开了一种基于载体短语注册的路由查询,其说明书及附图公开了如下技术内容:应用程序响应于来自服务器系统的通信请求注册载体短语;开发者可以注册载体短语;语音查询编码器接收语音查询;语音识别器接收数字信息并访问一个或多个语言模型,以将语音查询的数字编码转换成文本查询;查询路由器可以接收文本查询,在文本查询中找到载体短语,以及将文本查询的至少一部分发送到已经保留文本查询的应用程序;文本查询的载体短语位于本地载体短语数据库中或全局短语数据库中;如果载体短语被注册到多于一个应用程序,则查询路由器可以执行查询短语的消歧;查询路由器传输文本查询或其一部分以由被选择为注册有载体短语的应用程序接收;传送可以作为识别应用程序和文本查询的系统“意图”发生;在各种示例中,应用程序不保留载体短语,而是保留与载体相关联的“应用类型”;例如,“收听”载体短语可被指定为“音乐回收”应用类型相关。多个应用可能已经注册成“音乐回放”应用类型,并接受“收听”语音查询。其中所述全部或部分文本查询被提供给第一第三方程序,以使第三方程序执行以下动作:所述由第三方程序定义的动作以及基于所述全部或部分所述文本查询的内容动作。
基于证据3公开的内容,合议组认为:(1)、证据3中,应用程序向服务器系统注册的载体短语间并不具备用于描述一系列应用程序共有行为的表达式部分。更为具体地,在证据3中,应用程序向系统注册成某个应用类型,比如“音乐回放”应用类型,从而接收“收听”语音查询,也就是说,一个注册的载体短语通过与某一类型的应用程序进行关联而实现查询及程序调用,一个载体短语可能对应多个相同类型的应用程序,实现多个相同类型应用程序的调用可能;但是在本专利权利要求1中,注册中心的类节点中存储了用于描述一系列应用程序共有行为的带语义变量的正则表达式,该正则表达式对应至一公开函数集,与正则表达式对应有映射关系的是公开函数集,多个描述同一系列应用程序共有行为的正则表达式与同一公开函数集具有映射关系,这与证据3是完全不同的技术手段。(2)证据3中,相关注册载体短语只是针对某些应用所特定的,其互相之间并没有相关性或者相关数据结构,而本专利权利要求1中,至少类节点与应用程序节点中的正则表达式有特定的表达关系,即“所述应用程序节点,属于某个类节点并且继承了所属类节点的公开函数集的应用程序,同时所述应用程序节点还存在一些类节点所没有的带语义变量的正则表达式并映射到特定的函数调用”,该特征也没有被证据3公开。(3)证据3中记载了所述全部或部分文本查询的查询结果被提供给第一第三方程序,以使第三方程序执行以下动作:所述由第三方程序定义的动作以及基于所述全部或部分所述文本查询的内容动作,即上述查询结果直接由第三方应用接收并执行相关操作。但是,在本专利权利要求1中,在类节点或应用程序节点中的正则表达式被语音内容匹配,“S07:系统选择将被调用的应用程序,并把对应于带语义变量的正则表达式的函数调用写入系统为所选应用程序建立的私有目录中;S08:系统启动所选应用程序,应用程序在加载前会判断应用程序的私有目录中是否有函数和相应的变量,如果存在,应用程序将从私有目录中加载函数和变量,并进行相应函数的调用,否则加载默认初始页”,证据3只是在图4中涉及了有关远程载体短语的数据流程示意,不存在有关系统为应用程序建立相关私有目录,并在匹配成功后启动应用程序并查看私有目录以优先调用相应函数的技术特征。
基于上述分析可知,证据3没有公开本专利权利要求1有关类节点、应用程序节点的结构,也没有公开本专利权利要求1有关语音内容与正则表达式匹配后的执行过程,证据3与本专利权利要求1之间存在实质区别,两者不属于相同的技术方案,实现的技术效果也不同,因此权利要求1相对于证据3具备专利法第22条第2款所规定的新颖性。
7.3 与证据4相比
证据4公开了一种在计算装置上操作的自动化助理,其权利要求及说明书公开了如下技术内容:
所述助理包括:
输入装置,其用于接收用户输入;语言解释器组件,其用于解译所述已接收的用户输入以得到用户意图的表示;对话流处理器组件,其用于至少部分地基于所述已得到的用户意图的表示而识别至少一个域、至少一个任务以及用于所述任务的至少一个参数;
服务编排组件,其用于调用至少一个服务以用于执行所述已识别的任务;输出处理器组件,其用于基于从所述至少一个已调用的服务接收到的数据且进一步至少部分地基于当前输出模式而再现输出;以及输出装置,其用于输出所述已再现的输出。主动本体是用于助理的对数据建模与执行环境的整合。主动本体的一些节点可对应于域概念(例如餐馆)以及其特性(餐馆名称)。在一些实施例中,助理通过简化概念数据模型来提供对受约束选择任务的辅助。
在一些实施例中,助理所使用的概念数据模型包含选择类。在给定选择类的情况下,呈现给用户的用于受约束选择任务的数据模型包含:项目;项目特征;选择准则以及约束:项目为选择类的例子;项目特征为可呈现或者与至少一个项目相关联的特性、属性或所计算值。在一个实施例中,助理通过将经排序的准则列表(具有至少一个准则的隐式或显式约束)用作输入且产生一组具有突出特征的候选项目来执行受约束选择。在计算上,可将选择任务特征化嵌套的搜索:首先,识别选择类,接着识别重要选择准则,接着指定约束(可接受解决方案的边界),且以最佳配合的次序搜寻例子以找到可接受项目。
将本专利权利要求1与证据4公开的上述内容相比,合议组认为:(1)本专利权利要求1的注册中心与证据4的主动本体不同。证据4中,主动本体是用于助理的对数据建模与执行环境的整合,其提供将各种模型和数据源(域概念、任务流、词汇、语言模式辨识器、对话上下文、用户个人信息,以及从域和任务请求到外部服务的映射)系在一起的框架。在证据4的图45中描述的主动本体是用于选择任务的嵌套的搜索:首先,识别选择类,接着识别重要选择准则,接着指定约束(可接受解决方案的边界),其以最佳配合的次序搜寻例子以找到可接受项目。由此可知,图45描述的是一种基于经排序的准则列表选择项目的搜索方式。“选择类”的表达式只是为了筛选用户输入以进一步利用准则和约束选择类的例子,并没有“被许多拥有相同功能(行为)的应用程序复用”,也没有被映射到“技术文档可查的”函数集中。(2)本专利权利要求1中的表达式是直接对应于打开某个应用程序或让某个应用程序执行相应的函数调用,因此可被直接匹配以进行和应用程序相关的函数调用。但是证据4中的主动本体,是通过识别选择类、接着识别重要选择准则、接着指定约束并最终找到可接受项目的。因此,证据4描述的主动本体只有识别类以后,才能选择准则,并进而指定约束。可见,本专利中由表达式所组成的类节点、应用程序节点与证据4中主动本体中选择类、识别选择准则以及指定约束也非相同技术特征。(3)本专利权利要求1中语音内容与表达式匹配后的执行过程与对比文件4中所使用的概念数据模型选择类或者选择类的例子的执行过程也完全不同。证据4中,主动本体执行选择类和选择类的例子以最终选择任务。在给定选择类的情况下,呈现给用户的用于受约束选择任务的数据模型包含:项目,项目为选择类的例子。即只有选择类以后,呈现给用户的选择任务的数据模型才会包含选择类的例子。而本专利中语音内容与表达式匹配后能够直接调用应用程序。因此,权利要求1中语音内容与表达式匹配后的执行过程与证据4中所使用的概念数据模型选择类以后的执行过程是不同的技术手段,证据4中所使用的概念数据模型选择类的例子之后的执行过程也并没有揭示S07和S08的诸多技术特征。
基于上述分析可知,证据4与本专利权利要求1之间存在实质区别,两者不属于相同的技术方案,实现的技术效果也不同,因此权利要求1相对于证据4具备专利法第22条第2款所规定的新颖性。
7.4 与证据5相比
证据5公开了一种在计算装置上操作的自动化助理,其说明书以及附图公开了如下技术内容:证据5总体涉及智能系统,具体涉及用于构建智能自动化助理的应用类的工具。证据5的实施例依赖于“主动本体”的概念来构建和运行由智能自动化助理使用的应用。主动本体包括至少一个主动处理元件或概念。概念可以视为主动本体的基本构建块;概念既表示执行环境的子部分,又执行该子部分有关的计算或动作(例如自然语言理解、任务执行等)。概念适于匹配于特定类型的事实以便执行这些动作,并且可以具体被配置成管理时间约束、服务中介策略、融合策略或其他任务。概念包括模版,其中包括至少一个规则或规则集(包括多个规则)。每个规则包括:条件和相关联的动作。如果输入事实匹配规则的条件,则触发相关联的动作。服务中介适于异步地与远程面向服务架构和与主动处理元件通信以选择特定服务,委派任务、查询和更新,以及监测服务请求。服务器适于存储多个单独的主动本体,并运行应用域中的选择主动本体。
将本专利权利要求1与证据5公开的上述内容相比,合议组认为:(1)本专利权利要求1的注册中心与证据5的主动本体是不同的:证据5中,主动本体包括至少一个主动处理元件或者概念。概念适于匹配于特定类型的事实以便执行这些动作,并且可以具体被配置成管理时间约束、服务中介策略、融合策略或其他任务。每个概念包括至少一个规则或规则集(包括多个规则)。每个规则包括:条件,和相关联的动作。如果输入事实匹配规则的条件,则触发相关联的动作。也即是说概念只是一系列规则或规则集的集合,是一种抽象的概念。概念适于匹配特定类型的事实以便执行这些动作,这些动作是通过匹配概念中所包含的规则来进行的。从以上内容来看,本专利注册中心与证据5主动本体从存储的信息、数据结构与存储信息所对应的函数操作上来看都是不同的,是不同的技术特征。(2)本专利权利要求1中语音内容与表达式匹配后的执行过程与证据5中语音内容与规则或规则集匹配后的执行过程也完全不同。证据5中,每个“概念”包含至少一个规则或规则集(包括多个规则)。每个规则包括:条件,和关联的动作。当条件匹配时,则执行相关联的动作。即是说规则是执行逻辑判断的唯一单元。在证据5中描述的相关联的动作包括选择特定服务,并运行该服务。证据5中语音内容与规则或规则集匹配后的执行过程并没有直接或者间接公开权利要求1中语音内容与表达式匹配后的执行过程。
基于上述分析可知,证据5与本专利权利要求1之间存在实质区别,两者不属于相同的技术方案,实现的技术效果也不同,因此权利要求1相对于证据5具备专利法第22条第2款所规定的新颖性。
7.5 与证据6相比
证据6公开了一种处理用户输入的方法,所述方法在具有存储器和一个或多个处理器的电子设备处执行,其权利要求以及说明书公开了如下技术内容:所述方法包括:在所述电子设备处:接收来自服务提供方的第一组一个或多个预定义的任务类型;
将所述第一组一个或多个预定义的任务类型与跟所述服务提供方不相关的第二组预定义的任务类型相结合以生成多个预定义的任务;接收用户输入;根据所述输入,从所述多个预定义的任务类型中识别出相应的任务类型,所述相应的任务类型对应于所述第一组一个或多个预定义的任务类型中的一个;以及响应于识别出所述相应的任务类型,向所述服务提供方发送与所述输入相关联的执行任务的至少一部分的请求。
在一些实施例中,自然语言处理是基于知识本体进行的。知识本体为包含多个节点的分级结构,每个节点表示“可执行意图”或与“可执行意图”或其他“属性”中的一者或多者相关的“属性”。“可执行意图”表示数字助理系统能够执行的任务,“属性”代表与可执行意图或另一属性的子方面相关联的参数。知识本体中可执行意图节点与属性节点之间的连接定义由属性节点代表的参数如何从属于由可执行意图节点代表的任务。在一些实施例中,知识本体由可执行意图节点和属性节点组成。在知识本体内,每个可执行意图节点直接连接至或通过一个或多个中间属性节点连接至一个或多个属性节点。
知识本体中的每个节点与跟由节点代表的属性或可执行意图有关的一组字词和/或短语相关联。在一些实施例中,如果发现符号中的字词或短语与知识本体中的一个或多个节点相关联,则所述字词将触发这些节点。当多个节点被触发时,基于已激活节点的数量或/和相对重要性,自然语言处理器将选择可执行意图中的一个意图作为用户意图让数字助理执行的任务。在一些实施例中,存储器还存储服务提供方目录。在一些实施例中,服务提供方目录包括相应的第三方服务提供方系统所支持的一系列任务或胜任力。
将本专利权利要求1与证据6公开的上述内容相比,合议组认为:(1)本专利权利要求1的注册中心与对比文件6的知识本体是不同的:证据6中的知识本体为包含多个节点的分级结构,每个节点表示“可执行意图”或与“可执行意图”或其他“属性”中的一者或多个相关的“属性”。“可执行意图”代表能够执行的任务,属性代表与可执行任务意图或另一属性的子方面相关联的参数。其中,知识本体中的每个节点与跟由节点代表的属性或可执行意图有关的一组字词或/和短语相关。如果符号序列中的字词或短语与知识本体中的一个或多个节点相关联,则触发这些节点。当这些节点被触发,则基于已激活节点的数量和/或相对重要性,选择一个可执行意图作为任务类型。可执行意图节点,连同其连接的概念节点一起,可被描述为“域”。即证据6的知识本体是用于确认任务类型的。“可执行意图”或者“域”描述的是一种任务类型,属性存储的是描述这些任务的参数。由于证据6中的“可执行意图”或者“域”描述的只是一种任务类型,因此这些节点中的表达式并没有“被许多拥有相同功能(行为)的应用程序复用”,也没有被映射到“技术文档可查的”函数集中。
而且,证据6中的知识本体也不存在应用程序节点,知识本体中的属性存储的只是描述任务类型的参数。因此,注册中心与知识本体从存储的信息以及整体的数据结构来看,二者根本是不同的技术手段。(2)本专利权利要求1中建立应用程序的私有目录与对比文件6中服务提供方目录是不同的技术手段。证据6中服务提供方目录的数据结构只是包括相应的第三方服务提供方系统所支持的一系列任务或胜任力。显然,在证据6中选择任务的结果只能是根据服务提供方目录所存储的信息选择相应的第三方服务提供方,而不可能在这个时候写入和表达式对应的函数调用,并在接下来的步骤中读取这些写入信息以执行相应的函数调用。因此,权利要求1中私有目录的建立与证据6中服务提供方目录的设置是两个完全不同的技术手段。(3)本专利权利要求1中语音内容与表达式匹配后的执行过程与证据6中节点被触发后的执行过程不同。证据6中,节点被触发以后,会基于触发节点的数量或者重要性,选择可执行意图或者具有最多“已触发”节点的域。即是说节点被触发后,还需要参考其他节点的触发结果,才会执行接下来的操作,节点中表达式的匹配并不是独立与其他节点的表达式的匹配的。因此,权利要求1中语音内容与表达式匹配后的执行过程与证据6中节点被触发后的执行过程也是完全不同的技术手段。
基于上述分析可知,证据6与本专利权利要求1之间存在实质区别,两者不属于相同的技术方案,实现的技术效果也不同,因此权利要求1相对于证据6具备专利法第22条第2款所规定的新颖性。
7.6 与证据7相比
证据7公开了一种操作语音对话系统的方法,其权利要求以及说明书公开了如下技术内容:该用于操作语音对话系统的方法,所述语音对话系统与用户通信,所述系统使用语音识别设备和语音输出设备,用户可在语音对话系统中使用各种服务,并且各种服务可由用户在与语音对话系统的对话中进行选择,为了控制用户选择服务的对话,可使用一个数据库,所述数据库具有分层数据结构(DS)和多个节点(K)以及多个路径(P)用于将节点(K)互连,并且将节点(K)连接至位于数据结构(DS)中每个路径(P)的一端的服务对象(D),所述服务对象(D)表示可用的服务,所述节点(K)表示类别,其他类别和/或服务被进一步分类、并由所述分层数据结构(DS)的所述节点(K)的下一层次(II,III)上的深层节点(K)或服务对象(D)表示的,其特征在于,数据结构(DS)中的多个路径(P)至少通向服务对象(D)和/或节点(K)的一部分,一个或者多个关键词被分配给每个节点(K)和每个服务对象(D),当接收到用户的口语项目时,从所述口语项目中提取检索词,基于所述检索词,检索多个候选节点(K)和/或候选服务对象(D),根据预定的接受准则,其分配的关键词(S)与检索词相匹配,在各个检索步骤中执行检索,直至在一个检索步骤之后,候选节点(K)和/或服务对象(D)的数目大于最少预定数目、并且小于最大预定数目,然后,通过语音输出设备,生成语音输出菜单以通知用户候选节点(K)和/或候选服务对象(D)代表的类别和/或服务,由用户选择特定的类别或服务。
在实践中,各个服务被安排在分层决策树状数据结构中。用户与语音对话系统之间的对话起始于树状结构顶部的起点,并通过多个节点分别沿着路径或分支继续,其中所述每个节点代表特定的服务类别,直至到达路径的末端的服务对象,在所述末端处所找到的服务对象代表各个服务。在本文中,服务对象的概念可以理解为任意的数据对象、软件模块等,其代表服务本身和/或包含与服务有关的信息。这些服务对象D代表各自的服务。在一些实施例中,分配给特定节点的关键词可自动分配给更多归类于其下的节点或服务对象,即,关键词可向上或向下继承。一个类别的关键词“传递”至下一个低级层次的相关类别或服务。
将本专利权利要求1与证据7公开的上述内容相比,合议组认为:(1)本专利权利要求1的注册中心与证据7的数据结构是不同的:证据7中的数据结构在数据库中基于检索词执行特定类别和/或服务的检索。用户与语音对话系统之间的对话起始于树状结构顶部的起点,并通过多个节点分别沿着路径或分支继续,每个节点代表特定的服务类别,直至到达路径末端的服务对象,服务对象代表各种服务。其中,节点中存储了用于检索的关键词,并且这些关键词可自动分配给更多归类于其下的节点或服务对象。无效请求人在无效请求书中认为,证据7中的“II层的K节点”对应于权利要求1的类节点。对此合议组认为:K节点存储的只是一些代表服务类别的关键词,以在和检索词匹配时生成候选节点(K),目的是为了基于候选节点的数量向用户输出菜单以通知用户候选节点所代表的类别,K节点的关键词并没有“被许多拥有相同功能(行为)的应用程序复用”,也没有被映射到“技术文档可查的”函数集中。同时,本专利权利要求1的应用程序节点的表达式和证据7中的“服务对象”的关键词也是完全不同的。本专利权利要求1的应用程序节点中的应用程序继承的是类节点的公开函数集,证据7描述的服务对象继承的是所有父节点的关键词,这显然也是不同的。(2)本专利权利要求1中的表达式是直接对应于打开某个应用程序或让某个应用程序执行相应的函数调用,因此可被直接匹配以进行和应用程序相关的函数调用。但是证据7中检索词的匹配方法始于树状结构顶部的起点,并通过多个节点分别沿着路径或分支继续,每个节点代表特定的服务类别,直至到达路径末端的服务对象,节点中的检索词无法直接被匹配以实现对应函数接口的调用。因此,权利要求1中的注册中心与证据7中所述的数据结构从存储的信息与存储信息所对应的函数操作上来看都是不同的,是不同的技术特征。(3)本专利权利要求1中语音内容与表达式匹配后的执行过程与证据7中语音内容与节点中的关键词匹配后的执行过程也完全不同。证据7中,用户与语音对话系统之间的对话起始于树状结构顶部的起点,并通过多个节点分别沿着路径或分支继续,每个节点代表特定的服务类别,直至到达路径末端的服务对象。在匹配完从起点到服务对象的所有节点中(包括“II层的K节点”)的关键词以前,服务对象不会被选择。并且,和各个节点的关键词匹配是为了选择候选节点(K)或服务对象(D),并基于候选节点或者服务对象的数量生成语音输出菜单,并由用户选择特定的类别或服务。因此,权利要求1中语音内容与表达式匹配后的执行过程与证据7中语音内容与节点中的关键词匹配后的执行过程也是完全不同的技术手段。
基于上述分析可知,证据7与本专利权利要求1之间存在实质区别,两者不属于相同的技术方案,实现的技术效果也不同,因此权利要求1相对于证据7具备专利法第22条第2款所规定的新颖性。
7.7 与证据8相比
证据8公开了自然解析系统,更具体地涉及用于支持自然用户与一个或多个任意后端应用程序进行交互的技术。其权利要求以及说明书公开了如下技术内容:用户意图的解释是以分布式的方式在代理网络中进行的。代理网络中的每个代理可以被认为具有它自己的责任域的视图,如其解释策略所定义的。典型地,应用程序域由设计者组织成语义子域的层次结构,并且为语义层次结构中的每个节点定义单独的代理。在图2的实施例中,例如,金融代理214负责与金融有关的所有语义(即,在该例子中,在整个应用程序域中的所有查询)。图表代理负责检测和操作用户查询中与金融图表有关的部分,报告代理负责检测和操作用户查询中与金融报告有关的部分。
每当交互代理接收到标记串,它通过将“InitiateInterpretation-Message”类的对象中的输入标记定序器传送到网络的顶级代理,来启动对代理网络的解释尝试。在图2的网络中,顶级代理是系统代理。顶级代理包含一个或多个解释策略,在典型网络中,顶级代理的策略条件除了引用网络中更深的一个或多个其他代理外,几乎没什么作用。例如,系统代理212包含单个解释策略,其策略条件只不过引用金融代理而已。当且仅当金融代理可以对输入标记串的至少一部分作出声明时,这种策略条件适用于输入标记串。因此,当系统代理遇到该策略条件时,它将输入标记串转发到“InterpretItMessage”类中的对象的金融代理。金融代理因此被认为是系统代理的“下行链路”,并且系统代理被认为是在金融代理的“上行链路”。
金融代理在接收输入标记序列时,首先在其策略中查找引用金融代理下行链路的进一步代理的策略条件。如果存在这样的策略条件,则金融代理在”IntepretItMessage”中将输入标记串转发给下行链路代理的每一个并等待回复。在图2的实施例中,图表、报告和公司代理都分别在金融代理的策略条件中被引用,因此是金融代理的下行链路。金融代理下行链路的每个代理在收到InterpretItMessage时都是如此。当代理已经收到所有回复,代理根据代理的策略条件测试输入标记序列。在所有的策略作出声明后,代理使用预定的算法来选择“最好”的声明。代理然后将选择的一个或多个声明返回给代理的上行链路代理,该上行链路代理是在ClaimMessage类的对象中。如果代理无法对输入作出任何声明,则代理会向上行链路传送NoClaimMessage类的对象。
如Dejima策略引用所述,解释策略除其他事项外包含策略条件和策略动作。当代理收到来自另一个代理的消息来尝试解释和输入字符串时,它将输入的字符串按顺序与每个代理的策略条件进行比较。如果条件确实适用于输入字符串或输入字符串的一部分,则策略对输入字符串的适用部分作出“声明”,并将声明返回给请求解释的代理。声明中的优先级、置信水平以及重点都可以随后被上行链路代理用于与其他下行链路代理作出的其他声明进行比较,从而允许上行链路代理在竞争性声明中选择“最好的”声明。
将本专利权利要求1与证据8公开的上述内容相比,合议组认为:(1)本专利权利要求1的注册中心与证据8中多层次的数据结构是不同的:证据8中多层次的数据结构基于策略解释输入的字符串,它将输入的字符串按照顺序与每个代理的策略条件进行比较。如果条件确实适用于输入字符串或输入字符串的一部份,则策略对输入字符串的适用部分作出“声明”,并将声明返回给请求解释的代理。声明可以随后被上行链路代理用于与其他下行链路代理作出的其他声明进行比较,从而允许上行链路代理在竞争性声明中选择“最好”的声明。顶级代理利用策略条件判断是否需要把标记串转发给下行链路的金融代理。金融代理在接收输入标记序列时,首先在其策略中查找引用金融代理下行链路代理的进一步代理的策略条件。如果存在这样的策略条件,则金融代理把输入标记串转发给下行链路代理并等待回复。由此可知,各层次的代理的策略条件是用于判断是否需要把输入标记串转发给下行链路代理。无效请求人在无效请求书中认为,证据8中的“金融代理”对应于权利要求1的类节点。对此合议组认为:金融代理是系统代理的“下行链路”,金融代理在接收输入标记序列时,首先在其策略中查找引用金融代理下行链路的进一步代理的策略条件。如果存在这样的策略条件,则金融代理在“IntepretItMessage”中将输入标记串转发给下行链路代理的每一个并等待回复。当代理已经收到所有回复,代理根据代理的策略条件测试输入标记序列。在所有的策略作出声明后,代理使用预定的算法来选择“最好”的声明。代理然后将选择的一个或多个声明返回给代理的上行链路代理。即,金融代理的作用只是根据策略条件把输入标记序列转发给下行链路,并根据返回的声明使用预定的算法来选择“最好”的声明,并将选择的一个或多个声明返回给代理的上行链路代理。因此,金融代理的策略条件并没有“被许多拥有相同功能(行为)的应用程序复用”,也没有被映射到“技术文档可查的”函数集中。同样的,证据8中的金融代理的下行链路代理不可能对应于权利要求1的应用程序节点。从以上内容来看,注册中心与证据8中多层次的数据结构从存储的信息、数据结构与存储信息所对应的函数操作上来看都是不同的,是不同的技术特征。(2)本专利权利要求1中的表达式是直接对应于打开某个应用程序或让某个应用程序执行相应的函数调用,因此可被直接匹配以进行和应用程序相关的函数调用,但证据8中是通过上下级的代理来处理输入标记序列,顶级代理利用策略条件判断是否需要把标记串转发给下行链路的金融代理。金融代理在接收输入标记序列时,首先在其策略中查找引用金融代理下行链路的进一步代理的策略条件。如果存在这样的策略条件,则金融代理把输入标记串转发给下行链路代理并等待回复。因此上述两者的限定内容是不同的。(3)本专利权利要求1中语音内容与表达式匹配后的执行过程与证据8中输入标记序列与代理中的策略条件匹配后的执行过程也完全不同。证据8中,仅仅记载了顶级代理利用策略条件判断是否需要把标记串转发给下行链路的金融代理。金融代理在接收输入标记序列时,首先在其策略中查找引用金融代理下行链路代理的进一步代理的策略条件。如果存在这样的策略条件,则金融代理把输入标记串转发给下行链路代理并等待回复。并且下级代理作出的声明会被传递给上一级代理,以便上一级代理作出更好的声明,这个声明最终将被传递给更上一级的代理。可见,下一级代理的操作取决于上一级代理的作用域范围。不经过上级代理的策略条件匹配,下级代理无法执行任何策略动作。此外,金融代理子节点的策略条件匹配以后,也不是与后端应用程序进行通信,而是把声明结果传递给金融代理。这与权利要求1中语音内容与表达式匹配后的执行过程不同。
基于上述分析可知,证据8与本专利权利要求1之间存在实质区别,两者不属于相同的技术方案,实现的技术效果也不同,因此权利要求1相对于证据8具备专利法第22条第2款所规定的新颖性。
在权利要求1具备新颖性的基础上,从属权利要求2-5相对于上述证据也同样具备新颖性。本专利权利要求1-5符合专利法第22条第2款的规定。
8、关于专利法第22条第3款
专利法第22条第3款规定:创造性,是指与现有技术相比,该发明具有突出的实质性特点和显著的进步,该实用新型具有实质性特点和进步。
具体到本案:
请求人在评述权利要求1的创造性时,分别使用了证据1、3、4、5、7、8作为最接近的现有技术,再结合证据2、9-13中的一个或多个,或结合本领域公知常识。而由上述对新颖性的评述可知,权利要求1与证据1、3、4、5、7、8的区别至少包括:(1)所述语音识别系统包括注册中心,所述注册中心建立一个多叉树结构的语音识别系统结构图,其包括:所述根节点,存储有带语义变量的正则表达式,执行查找和打并存储在系统中的文件或应用程序的操作;所述类节点,存储了用于描述一系列应用程序共有行为的带语义变量的正则表达式,并把这些表达式映射到一个公开函数集中;所述应用程序节点,属于某个类节点并且继承了所属类节点的公开函数集的应用程序,同时所述应用程序节点还存在一些类节点所没有的带语义变量的正则表达式并映射到特定的函数调用;应用程序内部节点,存储了应用于应用程序内部的表达式以及所对应的函数调用;(2)本专利权利要求1的方法包括:S04:语音内容被传递给类节点,如果语音内容和所有类节点的带语义变量的正则表达式不匹配,则执行步骤S05,否则执行步骤S07;S07:系统选择将被调用的应用程序,并把对应于带语义变量的正则表达式的函数调用写入系统为所选应用程序建立的私有目录中;S08:系统启动所
选应用程序,应用程序在加载前会判断应用程序的私有目录中是否有函数和相应的变量,如果存在,应用程序将从私有目录中加载函数和变量,并进行相应函数的调用,否则加载默认初始页。(3)本专利权要求1的方法包括:S05:语音内容被传递给所有应用程序节点进行语义识别,如果输入的语音内容和所述应用程序节点的表达式匹配,系统就执行步骤S07,如果输入的语音内容和所有应用程序节点的表达式不匹配就执行步骤S06;S07:系统选择将被调用的应用程序,并把对应于带语义变量的正则表达式的函数调用写入系统为所选应用程序建立的私有目录中;S08:系统启动所选应用程序,应用程序在加载前会判断应用程序的私有目录中是否有函数和相应的变量,如果存在,应用程序将从私有目录中加载函数和变量,并进行相应函数的调用,否则加载默认初始页。
基于该区别技术特征可知,权利要求1实际解决的技术问题是:如何根据带有操作意图的输入语音启动某应用并让该应用直接执行和匹配表达式相对应的函数调用。
证据2公开了一种基于XML的语音识别参数处理方法,其中教导了使用“正则表达式”用于匹配。
证据9为基于正则表达式的语音识别控制策略研究,文中提出一种新型控制策略,把正则表达式和服务机器人的语音控制结合起来,前者利用预定义的正则表达式对语音识别内容进行模式检出,后者根据检出的模式对机器人进行策略控制。通过分析识别文本构建正则表达式,使用微软SAPI构建客户端语音引擎进行语音识别,在服务机器人平台上验证策略的有效性、实用性和快速性。该新型控制策略把正则表达式应用在语音识别控制策略中,使语音交互技术将人类之间的交流方式应用于人类与机器之间,使机器人用正则表达式对人类语言进行词法分析实现自然语言的理解。
证据10为《精通正则表达式》,其给出了正则表达式的定义。
证据11为“Android安全研究综述”,其中介绍了Android系统中的权限和隔离机制,涉及对文件/目录的访问权限管理。
证据12为“Android移动终端操作系统的安全分析”,其中介绍了Android系统中的安全机制,包括“沙箱”的概念。
证据13为《iOS5编程揭秘-iPhone与iPad应用开发入门》,其在第四章“继承和协议”中对“继承”、“类”、“树结构”进行了定义。
证据14为《iOS 6 Recipes》,其公开了“项目根(根节点)”和“框架”,其中框架的库联接到项目。
证据15为《Unix环境高级编程》,其公开了文件和目录的树结构,其具有“根”和“母/子目录”。
由此可见,证据2、9-13均没有公开上述区别技术特征,也没有给出应用上述区别技术特征的启示,且目前也没有证据证明上述区别技术特征为本领域的公知常识,同时权利要求1的技术方案通过采用上述区别技术特征,能够达到使得现有的语音识别系统能无缝的应用到用户客户端现有的应用程序的执行上,同时使得语义识别带有更多的个性化特征,同时第三方应用程序的语义识别库可以被其他的应用程序发现并且接收来自其他应用程序的操作请求的技术效果。因此,本专利权利要求1相对于上述现有技术具备创造性,符合专利法第22条第3款的规定。
在此基础上,引用权利要求1的从属权利要求2-5相对于上述现有技术也具备创造性,符合专利法第22条第3款的规定。
综上所述,请求人提出的所有无效理由均不能成立。基于以上事实和理由,本案合议组依法作出如下审查决定。
三、决定
维持ZL201310333827.X号发明专利权有效。
当事人对本决定不服的,可以根据专利法第46条第2款的规定,自收到本决定之日起三个月内向北京知识产权法院起诉。根据该款的规定,一方当事人起诉后,另一方当事人作为第三人参加诉讼。
来源:专利复审委网站
编辑:IPRdaily赵珍 校对:IPRdaily纵横君
推荐阅读
“投稿”请投邮箱“iprdaily@163.com”
「关于IPRdaily」
IPRdaily成立于2014年,是全球影响力的知识产权媒体+产业服务平台,致力于连接全球知识产权人,用户汇聚了中国、美国、德国、俄罗斯、以色列、澳大利亚、新加坡、日本、韩国等15个国家和地区的高科技公司、成长型科技企业IP高管、研发人员、法务、政府机构、律所、事务所、科研院校等全球近50多万产业用户(国内25万+海外30万);同时拥有近百万条高质量的技术资源+专利资源,通过媒体构建全球知识产权资产信息第一入口。2016年获启赋资本领投和天使汇跟投的Pre-A轮融资。
(英文官网:iprdaily.com 中文官网:iprdaily.cn)
本文来自专利复审委网站并经IPRdaily.cn中文网编辑。转载此文章须经权利人同意,并附上出处与作者信息。文章不代表IPRdaily.cn立场,如若转载,请注明出处:“http://www.iprdaily.cn/”
文章不错,犒劳下辛苦的作者吧