文献文献文献文献文献新科技科技科技科技知识产权
#文章仅代表作者观点,不代表IPRdaily立场#
来源:IPRdaily NnTech 新科技评测团队
原标题:挑战日本最强AI翻译引擎!出版社这次拿出了硬科技
机器翻译一直是阻碍专利领域技术全球跨语言信息化应用的一个核心技术难题。
而由于近年来人工智能技术的飞速发展,机器翻译公司如雨后春笋般迅速发展,国外的Google、微软已经在各领域应用机器翻译技术。
笔者了解到,近日,日本一款DeepL在线机器翻译软件,号称在实例评测中碾压了谷歌翻译,更是引起了机器翻译领域的轰动!
尽管如此,专利领域的机器翻译由于科技词语的晦涩,同时要求具有很严谨的法律规范性,增加了人工智能技术在专利机器翻译中应用的难度。
而随着技术的不断更新迭代,这种情况正在逐步发生变化!
笔者发现,作为专利翻译国家队的知识产权出版社也推出了应用于科技与专利文献翻译的机器翻译引擎——科专笑飞,或许这将极大推进机器翻译技术在专利领域的应用!
今天NnTech 新科技评测团队,将对最近很火爆的DeepL与科专笑飞做一个专业评测,看看在科技文本机器翻译领域,究竟谁能更胜一筹!
一、汉日双向评测
评测样本:
样本随机取自2020年最新的专利申请文献,共计50句
评测时间:
评测时间为2020年4月2日
评测对象:
评测对象为科专笑飞机器翻译系统和DeepL机器翻译系统的当前最新翻译结果结果取自两系统官方网站翻译界面:
科专笑飞:www.iptranslation.net
DeepL:https://www.deepl.com/translator
评测方式:
评测采取人工评测的方式
说明:人工评测,以国家语言文字工作委员会发布的机器翻译译文的人工评测标准为标准,若干名评测人员按照标准分别为两种翻译结果进行打分,分制为100分制。人工评测采用随机评测,事先未告知评测人员所评系统相关具体细节及所阅读的译文是哪个系统的译文,打分过程中评测人员无沟通,以此来尽可能地避免人工评测的主观性。
汉-日方向评测结果:
汉-日方向评测结果如下表及柱状图:
日-汉方向评测结果:
日-汉方向评测结果如下表及柱状图:
评测结论:
从得分上来看,科专笑飞机器翻译系统汉-日、日-汉双向翻译效果明显优于DeepL翻译效果。
汉-日方向,科专笑飞机器翻译系统的平均分比DeepL机器翻译系统的得分高出了13.5分;日-汉方向,科专笑飞机器翻译系统的平均分比DeepL机器翻译系统的得分高出了9.5分;从双向来说,两者分差都比较大,这证明了科专笑飞机器翻译系统汉-日、日-汉双向翻译要明显优于DeepL机器翻译系统。
二、汉英双向评测
评测样本:
样本随机取自2020年最新的专利申请文献,共计40段(约120句)
评测时间:
评测时间为2020年4月2日
评测对象:
评测对象为科专笑飞机器翻译系统和DeepL机器翻译系统的当前最新翻译结果。结果取自两系统官方网站翻译界面:
科专笑飞:www.iptranslation.net
DeepL:https://www.deepl.com/translator
评测方式:
评测采取人工评测的方式
汉-英方向评测结果:
汉-英方向评测结果如下表及柱状图:
英-汉方向评测结果:
英-汉方向评测结果如下表及柱状图:
评测结论:
科专笑飞机器翻译系统汉-英、英-汉双向翻译效果明显优于DeepL翻译效果。
汉-英方向,科专笑飞机器翻译系统的平均分比DeepL机器翻译系统的得分高出了9.115分;英-汉方向,科专笑飞机器翻译系统的平均分比DeepL机器翻译系统的得分高出了5.34分;从双向来说,两者分差都比较大,这证明了科专笑飞机器翻译系统汉-英、英-汉双向翻译要明显优于DeepL机器翻译系统。
三、评测实例
评测团队随机抽取了评测实例,示例如下:
实例一:
结论:
科专笑飞的译文在专利术语的选择上更加地道,DEEPL的译文在选词翻译方面按照原文进行直译,虽然翻译正确,但相对来说,表达不够专业地道。
实例二:
结论:
科专笑飞引擎对长句、长段落进行了综合性的学习和处理,能够保证整体的结构完整。而DeepL的引擎在长段落整体翻译时,会出现漏译、句子信息缺失、翻译不完整的情况。比如此例中,该引擎并没有将句子完全翻译完,丢失了句子后半部分的信息。
四、评测总结
从测试结果可以看出来,对于专利翻译或科技文献的翻译,科专笑飞已经做了专门的训练。以此同时对专利文本翻译中的一些表达方式及格式处理也进行了优化处理,更适合科技领域的文本翻译。
知识产权出版社“秘密”进行的机器翻译引擎研制项目究竟是什么来头?
测试团队从科专笑飞的官网了解到:
科专笑飞是由知识产权出版社自主研发的新一代人工智能多语种专利文献机器翻译系统,实现了英、日、德等多语种与中文之间双向的全自动机器翻译和人机交互计算机辅助翻译。
系统基于全球多语种专利文献数据,采用国际前沿的多策略神经网络机器翻译核心技术,融合模板、统计、规则、实例等多种机器翻译方法,针对专利文献特定域信息的用词习惯、句法结构以及语义选择等特点,对翻译知识库进行优化配置和构建,使译文达到了90%的准确率和商用推广性,是帮助用户实现知识产权领域多语言信息获取和翻译的有力工具。
其技术优势在于:
采用国际前沿的多策略神经网络机器翻译核心技术,融合模板、统计、规则、实例等多种机器翻译方法,针对专利文献特定域信息的用词习惯、句法结构以及语义选择等特点,对翻译知识库进行优化配置和构建,使专利译文达到了90%以上的准确率。
科技创新目前已经成为全球未来竞争的核心,而科技文献利用将成为未来科技创新技术情报的重要信息途径,而机器翻译正是解决全球跨语言技术应用的加速器。
评测团队惊叹国内AI技术在专利领域落地技术研发实力和技术先进性,类似科专笑飞这样的最新产品也代表了目前全球技术机器翻译引擎的最高水准。
相信未来,科专笑飞会给我们带来更多的改变与惊喜!
来源:IPRdaily NnTech 新科技评测团队
编辑:IPRdaily王颖 校对:IPRdaily纵横君
点击图片,查看专题详情!
「关于IPRdaily」
IPRdaily是具有全球影响力的知识产权媒体,致力于连接全球知识产权与科技创新人才。汇聚了来自于中国、美国、欧洲、俄罗斯、以色列、澳大利亚、新加坡、日本、韩国等15个国家和地区的高科技公司及成长型科技企业的管理者及科技研发或知识产权负责人,还有来自政府、律师及代理事务所、研发或服务机构的全球近100万用户(国内70余万+海外近30万),2019年全年全网页面浏览量已经突破过亿次传播。
(英文官网:iprdaily.com 中文官网:iprdaily.cn)
本文来源IPRdaily NnTech 新科技评测团队并经IPRdaily.cn中文网编辑。转载此文章须经权利人同意,并附上出处与作者信息。文章不代表IPRdaily.cn立场,如若转载,请注明出处:“http://www.iprdaily.cn/
文章不错,犒劳下辛苦的作者吧