自人工智能技术兴起后,文本与数据挖掘的普遍运用,对于进一步提高科研效率、加快科学发现发挥着越来越重要的作用。利用文本与数据挖掘开展科学研究,已经成为人工智能时代科学研究自由的应有之义。然而,文本与数据挖掘过程中所涉及的文本与数据的提取、复制与传输等环节多受著作权法所限制。为了突破这种限制,不少国家相继出台法律、法规或以判例等形式,明确了运用人工智能技术进行的文本与数据挖掘,可以作为或者有条件作为著作权法例外适用的对象加以支持和保护,以促进实现科技自由、自立和自强,推动人工智能技术的运用与发展。
欧盟
欧盟成员国拥有丰富的文本与数字资源。但由于著作权法的严格限制,欧盟研究者需要艰难地寻求出版商的批准以获取付费内容。2019年,在制度因素和现实原因共同驱动下,欧盟通过《版权指令》,将文本与数据挖掘纳入了著作权合理使用制度之中。
从《版权指令》的规范内容来看,其对文本与数据挖掘合理使用的要素要求相对保守。《版权指令》第3条为文本与数据挖掘的合理使用设定了限制条件:在行为主体方面,《版权指令》将其定义为“科研机构和文化遗产机构”,但是否可以包含商业性研究机构则由欧盟成员国国内法自行决定;在行为目的方面,仅限定为科学研究。同时,《版权指令》第4条赋予了著作权人“选择—退出”权利,著作权人可以对例外提出保留,在著作权人提出反对的情况下,不能对其作品进行文本数据挖掘。欧盟《版权指令》也选择在有限条件下适用合理使用条款。
英国
英国作为版权制度建设的先驱,已率先就文本与数据挖掘的版权问题进行立法。英国知识产权局将文本与数据挖掘定义为:从处于机器可读状态的资料中提取具有价值信息的过程,过程中目标资料可将被大量复制、提取、演绎和整合。
2014年6月,英国修改《版权法》,专门制定了文本与数据挖掘例外条款,目的就是要广泛开发文本和数据信息,充分挖掘这些信息背后的价值。英国修订后的《版权法》新增第29A条,明确了文本与数据挖掘的合法性。该法条规定:合法获取作品的主体为非商业性数据分析,对合法获取的任何作品进行的复制行为不构成侵权,属于对作品的合理使用。但是,英国《版权法》将文本与数据挖掘的目的限定为非商业的计算分析,且只豁免该技术过程不可避免的复制行为,对于汇编、翻译等行为则未作规定。
法国
2016年,法国修订《法国知识产权法典》。新修订的条款,不仅对著作权作品专门设置了挖掘例外,还对数据库权进行了限制,即允许社会公众对已发表的、合法获取的科学作品以及数据库文献进行非营利性的挖掘,并且对文本与数据挖掘合理使用的适用对象作了严格限定,仅适用于科学作品或与之相关的文本与数据,而并非所有经合法获得的作品。
德国
2017年6月,德国修订了《著作权及邻接权法》,其中第60条(d)款规定了文本与数据挖掘例外:为了自动分析大量作品用于科研,允许使用者复制原材料并创建规范化与结构化的资料库,且仅限为非商业目的。同时,该例外还允许使用者将该资料库向一定范围内的公众开放以进行科学研究,以及利用该资料库进行科研质量检测。但该法同时明确:相关研究结束后即应删除资料库与其他相关复制件,除非为了存储将相关资料发送给该法第60e与60f条款中规定的不具任何直接或间接商业目的的图书馆、档案馆、博物馆等。在第60g条款中,又明确了权利人不得通过协议排除有权使用者使用该例外的权利。
德国《著作权及邻接权法》特别对作为邻接权客体的数据库使用行为作出规定:使用者在被相关权利人授权访问数据库作品的情况下,以及对作为邻接权客体的数据库均适用文本与数据挖掘例外。另外,除了数据库作品,德国的文本与数据挖掘例外同样没有将材料来源的合法性作为实施的要件。
日本
2009年,日本《著作权法》规定,为了利用计算机进行信息分析,在必要的范围内将著作权作品拷贝至存储介质,以及对其进行合理性改编是被允许的,但他人专门用来作信息分析的数据库除外。2018年,日本《著作权法修正案》在保留著作权例外的一般条款的基础上,将“计算机信息分析”的目的修改为“为了提供新的知识或信息”。
从日本立法的修订中可以看出,日本目前对文本与数据挖掘行为的合理使用认定采取了一种较为灵活、开放的态度,为数据挖掘及人工智能的开发研究提供了自由发展的空间,也促进了日本近年来大数据和人工智能产业的迅速发展。
美国
美国是判例法国家,目前也没有制订法律或以法律条文的形式承认文本与数据挖掘的正当性。但是,在美国各级法院的多项司法判决中,对文本与数据挖掘的合理使用予以肯定。以谷歌数字图书馆系列案件中的HathiTrust案为例,HathiTrust数字图书馆就是美国多所大学共同设立的公益性文化机构,该机构亦与谷歌签约,使其资源库容纳了Google提供的超过1000万件作品的数字副本。利用文本与数据挖掘全文检索服务,使用者可以通过搜索关键词得以实现不经浏览全文便可获知该词汇与作品中相关情况的目的。
HathiTrust数字图书馆案的法官认为,创建数字复制件并提供给用户的行为构成了合理使用,因为创建全文检索数据库是构成转换性使用的典型做法之一,原因在于关键词搜索的结果具有与原文不同的目的、特征和意义。即使谷歌下载并存储了整本书的完整数字副本也是如此。在其他的一些案件中,法院对文本与数据挖掘行为在法律上的正当性也予以了高度认可。无论是否为商业性主体,也无论是否为营利目的,只要满足“转换性使用”的认定标准,即可以被认定为合理使用。
南非
南非于2019年3月通过《著作权法修正案》。该修正案虽没有明确规定对文本与数据挖掘的版权例外模式,但采取了开放式的合理使用四要素规定,相关例外条款的范围明显大于文本与数据挖掘的行为,且适用中亦可能存在交叉的情况:例如,著作权法12A条款列举的使用目的中的第一项为以“研究、私人学习或个人使用”为目的,使用者可对作品合法的副本在不同设备上采取各种利用方式,对于主体或使用目的的非商业性并不作明确要求。因此,针对合法副本使用者即可适用该例外进行文本与数据挖掘相关的“各种使用行为”,在著作权法的视域中,其应已涵盖文本与数据挖掘技术手段中的临时复制与改编例外的行为。针对非合法副本的文本与数据挖掘行为,则可能需要结合12A条款中的合理使用四要素的兜底标准于个案中再行判断。总体而言,南非的文本与数据挖掘合理使用例外的实现,涵盖规定临时复制与改编情形之外的复制、演绎、传播等使用行为,这也意味着整体使用行为的合法性应当是判定的前置条件。
如今,人工智能被视为科技创新发展的“超级风口”,世界各国都愈加重视推动人工智能产业的健康发展。文本与数据挖掘作为一项信息时代中涉及多领域的研究技术,具有无可替代地解决既有问题、发现未知规律的作用。实践证明,在数字驱动经济的背景下,创新越来越依赖于海量数据分析的帮助,如果过于保护著作权人的利益,对使用人的过分桎梏可能会影响合理使用,甚至会影响国际范围内知识流动与科技创新。为促进人工智能产业的整体发展,给予文本与数据挖掘行为合理使用的空间,将成为世界各国推动人工智能技术发展的趋势。
(作者单位:南京师范大学法学院、中国法治现代化研究院、江苏致邦律师事务所)