人工智能训练数据中的知识产权权利——欧洲视角

#文章仅代表作者观点，不代表IPRdaily立场，未经作者许可，禁止转载#

来源：IPRdaily中文网（iprdaily.cn）

作者：Toby Bond Associate

Katharine Stephens Partner

原标题：人工智能训练数据中的知识产权权利——欧洲视角

在未经许可的情况下使用第三方数据训练人工智能系统，将面临哪些风险？推出一款可能被第三方知识产权数据权利“污染”的人工智能产品，可能面临多大风险？评估使用“污点数据”训练并在数据源或数据部署中任何一环可能涉及欧洲的人工智能系统的风险是一件极其重要并极具挑战的工作。本文将聚焦欧洲人工智能训练数据中的各种知识产权权利，这些内容对中国科技公司和科技律师同样非常重要。

在未经许可的情况下使用第三方数据训练人工智能系统，将面临哪些风险？本文将聚焦欧洲人工智能训练数据中的知识产权权利，这些内容对中国科技律师同样非常重要。

为了充分利用人工智能技术，许多组织机构正在竞相收集尽可能多的数据。对大量多元化数据的巨大渴求，促使开发人员去搜寻可以用于训练人工智能系统的已有数据。但是，这些数据分为多种形式，而且往往归属于错综复杂的第三方知识产权，因此使用方式可能受到限制。

由于数据上的法律权利缺乏可视性，训练使用了第三方数据的事实可能只有在后期产品即将上市时才会显现。此时就会面临一个重大问题：推出一款可能被第三方知识产权数据权利“污染”的人工智能产品，可能面临多大风险？

这个问题往往由科技律师回答，不会引起太多关注。数据可以轻松地从一个国家传输到另一个国家，而人工智能系统也可以在短时间内部署到多个司法管辖区，因此这个问题的答案取决于：数据源自何处，人工智能系统现已部署在哪里，以及未来还将部署在哪里。如果其中任何一个环节涉及到欧洲，中国科技律师就应该考虑是否存在任何欧洲法律风险。例如，近期英国上诉法院对Celgard诉Senior的判决结果显示，欧洲地区的法院可能倾向于阻止进口那些在中国开发过程中涉嫌滥用商业秘密的产品（复制链接至浏览器参见本所近期判决报告https://www.twobirds.com/en/news/press-releases/2020/united-kingdom/court-of-appeal-upholds-interim-injunction-in-trade-secrets-case）。

尽管还要具体情况具体分析，但是从欧洲角度来看，以下框架有助于评估法律和实践中的知识产权风险。

哪些权利适用？

将数据作为一种可“拥有”的财产已成为普遍事实，因此我们完全有理由假设数据与用于存储数据的电脑硬件一样，都是一种财产。但是从欧洲角度而言，可用于保护有形财产不受非法占有或干扰的法律，并不适用于数据本身。相反，数据被视为与“信息”同属一个法律分类，传统上并不属于有形财产的权利范围。

虽然数据本身可能不被视为一种财产形式，但是许多重合的法律权利可能影响到数据的获取、使用与披露。除了欧洲数据保护法（对将个人数据/个人身份信息用于训练人工智能系统有所限制），从欧洲的角度来看，主要数据权利有：(1) 合同权利；(2) 保密信息/商业秘密；(3) 版权（数据本身或原始数据库）；(4) 欧盟数据库权。

不同的权利，不同的风险

适用于数据的权利性质之所以重要，因为该权利定义了一个框架。欧洲的法院将根据框架，评估是否应对未经授权而使用数据训练人工智能系统的行为，采取制裁措施。除相关权利的性质以外，发布使用“污点数据”训练的人工智能系统所面临的风险，还取决于持续使用该人工智能系统是否会涉及任何权利。例如，有可能出现“持续违规”的情况，即存在第三方权利的一些训练数据最终成为训练系统的一部分。而这种情况是否会发生，则取决于人工智能系统的技术实施方式。以经过训练的神经网络为主的数据库一般不包含任何训练数据；但是，人工智能系统的其他元素可以保留原始数据元素。虽然不持续使用第三方数据的人工智能系统的风险状况一般较低，但具体还是取决于保护第三方数据的权利的性质。

知识产权权利——版权与数据库权利

如果数据受版权或数据库权利保护，欧洲的法院可采用广泛救济措施对相应侵权行为进行制裁。侵犯版权和数据库权利的行为，都将按照《知识产权执法指令》(2004/48/EC https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:32004L0048R(01)) 进行处理。虽然该指令的具体执行情况因国家而异，但总的来说，该指令要求欧洲法院允许知识产权持有人寻求补救措施（如召回侵权软件）、初步和永久禁令、损害赔偿（根据所遭受的损害、非法利润或合理的许可使用费）、诉讼费用承担和判决公布。

根据《知识产权执法指令》，可针对“被发现侵犯知识产权”的商品采取补救措施，而禁令的目的则是“禁止继续侵权”。经过训练的人工智能系统如果不包含任何未经授权的第三方数据，则一般不会受到这些知识产权相关措施的约束，因为未来对该系统的使用不会导致持续侵犯知识产权（如果人工智能系统是通过滥用保密信息的方式进行训练的情况，请参见下文“保密信息/商业秘密”部分）。授予权利持有人的主要救济形式是对训练过程中发生的任何侵权行为进行经济赔偿。

合同

侵犯合同权利首先会引起损害赔偿方面的诉求，与侵犯知识产权的情况相比，原则上一般不会发出禁止人工智能系统商业化的禁令。如果合同是基于知识产权，比如用于人工智能训练的数据集，则违约可能导致禁令。而假设没有持续的知识产权侵权行为，则情况与上文“知识产权”一节中所讨论的情况类似，即使有合同权利的叠加。

保密信息/商业秘密

非法使用保密数据来训练人工智能系统可能涉及欧盟最近公布的《商业秘密指令》(2016/943/EU https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:32016L0943) 中规定的保护措施。这些保护措施与知识产权保护的范围相类似（如损害赔偿和临时/永久禁令，禁止非法使用或披露保密数据）。

如果用于训练人工智能系统的第三方数据是保密的，那么欧洲的法院认定侵权并禁止使用经过训练的人工智能系统的可能性更高。多个欧洲司法管辖区倾向于发出禁令，阻止将以滥用商业秘密的方式开发出来的产品商业化。欧盟《商业秘密指令》现在还要求所有成员国针对“侵权商品”（“其外观设计、特征、功能、生产工艺或营销从非法获得、使用或披露的商业秘密中获得重大利益的商品”）提供救济。这些措施包括召回和销毁、禁止销售的禁令和损害赔偿。禁令包括临时和永久禁令。如果是临时禁令，其期限应是“足以消除侵权人从非法获取、使用或披露商业秘密中可能获得的任何商业或经济利益”。

欧洲的法院尚未考虑将这些侵权商品条款适用于人工智能系统等产品。如果人工智能被嵌入实物产品中或通过实物媒介分销，则可能适用这些规定。对于作为服务提供的人工智能系统的应用方式，目前尚不明确，例如SaaS（软件即服务）。根据欧盟法院未来的任何指导意见，欧洲的法院认定侵权并阻止训练过程中非法使用商业秘密的“人工智能系统作为服务”进行商业化的意愿，将取决于《商业秘密指令》在各国的执行情况。各欧洲司法管辖区的情况可能有所不同，但我们在德国、法国、意大利、西班牙和芬兰进行的一项调查结果显示，这些司法管辖区的法院更有可能认为该指令在各国的执行中将涵盖作为服务提供的人工智能系统。

此外我们需要认识到，《商业秘密指令》只规定了商业秘密保护的最低标准要求（即成员国可以自由提供更广泛的保护）。例如，在英国，法院拥有灵活而广泛的权力，可以对滥用保密信息的行为实施制裁。因此对基于滥用保密信息而训练的人工智能系统实施禁令，一般不会有任何概念上的困难。不过英国法院在评估是否发出禁令以及禁令期限时，将认真考虑训练数据的保密程度以及数据使用范围。如果数据被用于训练目的，但并不构成最终人工智能系统的一部分，法院可能将发出“跳板禁令”，期限仅限于某人从公共领域的资源开始到反向工程或反编译信息所用时间。

有何损害？

虽然大多数科技律师最关注的是禁令阻止人工智能系统商业化的可能性，但第三方获得巨额经济补偿的可能性也是一个关键问题。在欧洲，尽管《知识产权执法指令》和《商业秘密指令》允许法院针对除经济因素之外的其他因素（如侵权行为对权利持有人造成的道德偏见）做出损害赔偿裁决，但这种强化赔偿形式的使用频率，往往不及某些美国法规（如《商业秘密保护法》）中规定的惩罚性或强化损害赔偿。不过这并不是说欧洲的法院在特定情形下不会做出巨额赔偿判决。

无论是知识产权侵权案件还是商业秘密案件，评估损害赔偿的出发点都是被侵权方所遭受的不利经济影响（包括利润损失），或侵权人所获得的任何不公平利润。另外，法院也可以根据如果侵权人被许可使用相关知识产权或商业秘密而应支付的许可使用费或相应费用金额，一次性确定损害赔偿数额。在任何一类案件中，法院都会关注因侵权行为而遭受的实际损害。

虽然这些原则为评估侵犯训练数据的知识产权和商业秘密相关权利提供了共同出发点，但各国的具体应用将会有所不同，从而导致实际裁决结果出现巨大差异。关于违反训练数据相关合同权利的损害赔偿，欧洲各个司法管辖区的立场也可能有很大不同。

实践中的风险因素

除上述法律问题外，从实践角度来看，风险评估过程中还应考虑以下问题：

· 权利持有人审计：如果数据是基于数据许可而从权利持有人那里获得的，该许可是否意味着权利持有人具有审计权？数据审计是权利持有人争取更多收入的一种常见方式，方法是发现被许可数据被用于许可范围之外的行为，然后要求对方支付更多费用，否则就将提起诉讼。

· 可能的数据来源：权利持有人是否是相关类型数据的唯一来源？如果数据可以从一系列的商业来源获得，则被识别的风险将可能低于数据来自市场上唯一提供方的情况。

· 权利持有人的身份：商业数据提供方会敏锐地意识到其数据的价值，而且相比于不太注重数据商业化的其他组织机构，他们将更积极地对侵权行为进行追责。

总结

评估使用“污点数据”训练并在欧洲上市的人工智能系统风险是一件极具挑战的工作，往往涉及到一些法律和实践因素的平衡。但是，确定特定数据相关权利，判断违规行为是“过去时”还是“进行时”，以及审查相关欧洲司法管辖区可能采取的制裁措施，都能帮助您更好地了解风险状况。

鸿鹄律师事务所（Bird & Bird）

鸿鹄现有1350多名律师和法律从业人员，在全球设有29个办公室，擅长运用领先的专业知识提供全方位的法律服务，所涉领域包括商事、公司、欧盟与竞争、知识产权、争议解决、劳动法、金融、以及房地产。鸿鹄成功的关键在于行业专注性。本所客户的业务基础是技术和无形资产，众多客户在规范市场运营。为了更好地满足客户需求，我们不断深入了解重要行业，包括汽车、航空与国防、能源与公用事业、金融服务、医疗保健与生命科学、零售与消费品、媒体、娱乐与体育、信息技术与通信。鸿鹄在世界各地的主要商业中心都建立了办公室。我们是一家真正意义上的国际律所：我们共享相同的目标、会计制度和利润池，因为我们承诺在适当的地点安排适当的律师为客户提供服务。鸿鹄律师事务所有着开放、灵活的企业文化，力求提高反应速度，尽快帮助客户解决所面临的商业压力。为客户提供卓越的服务永远是我们的头等大事，无论客户如何定义卓越。

作者

人工智能训练数据中的知识产权权利——欧洲视角

本地联系人

人工智能训练数据中的知识产权权利——欧洲视角

来源：IPRdaily中文网（iprdaily.cn）

作者：Toby Bond Associate

Katharine Stephens Partner

编辑：IPRdaily王颖校对：IPRdaily纵横君

注：原文链接：人工智能训练数据中的知识产权权利——欧洲视角（点击标题查看原文）

如有想看文章主题内容，欢迎留言评论~

人工智能训练数据中的知识产权权利——欧洲视角

「关于IPRdaily」

IPRdaily是具有全球影响力的知识产权媒体，致力于连接全球知识产权与科技创新人才。汇聚了来自于中国、美国、欧洲、俄罗斯、以色列、澳大利亚、新加坡、日本、韩国等15个国家和地区的高科技公司及成长型科技企业的管理者及科技研发或知识产权负责人，还有来自政府、律师及代理事务所、研发或服务机构的全球近100万用户（国内70余万+海外近30万），2019年全年全网页面浏览量已经突破过亿次传播。

（英文官网：iprdaily.com 中文官网：iprdaily.cn）

本文来自IPRdaily中文网（iprdaily.cn）并经IPRdaily.cn中文网编辑。转载此文章须经权利人同意，并附上出处与作者信息。文章不代表IPRdaily.cn立场，如若转载，请注明出处：“http://www.iprdaily.cn/