数据新闻数据挖掘的著作权侵权风险与例外制度构建

    贾磊

    【摘要】数据新闻的产生和發展依托于互联网和大数据的结合,文本和数据挖掘是其生成的必要环节。这一环节涉及对文本和数据的再现和利用,因公众对著作权保护认知有限及著作权制度供给的不足,该环节行为性质具有不确定性,存在著作权侵权的隐患,影响了数据新闻的发展。基于著作权法的立法目的及合理使用制度的平衡意义,参酌新闻的意义及其传播本质要求,应构建数据新闻领域文本和数据挖掘的著作权限制制度,促进新闻事业的新发展。

    【关键词】数据新闻;文本和数据挖掘;著作权侵权;著作权限制一、引言

    互联网的高速发展已经彻底改变了人们的信息获取方式,网络或手机已经取代传统报纸、广播电视成为公众获取新闻的主要途径。这种新闻获取途径的变化决定了新闻本身形式上已经发生了变化。互联网的高速发展与大数据的结合更是给新闻业带来了新的挑战和机遇。数据新闻正是在这两者相互影响与互动背景下兴起的一种新型新闻形式,其在生产流程、展现方式等方面也表现出了不同于传统新闻的一面。数据新闻的产生契合了我国媒体融合发展的趋势,具有巨大的发展空间。

    数据新闻并非传统新闻的简单升级,而是一种全新的新闻范式,是媒体融合时代传统媒体的重要抓手和切入点,把握数据新闻制作和传播的规律,能够帮助传统媒体找到与新兴媒体融合发展的有效途径[1]。数据新闻作为一种新的新闻表现形式,具有生成过程的复杂性、参与主体的多元性、表现形式的复合性等特点。由于数据新闻对数据和文本的依赖,对其生成过程中文本和数据运用行为的性质判断及是否存在著作权侵权风险,具有探讨的理论意义和时间价值。目前鲜有文献对此进行分析,这与数据新闻的未来发展空间与媒体融合的经济社会技术背景是不匹配的,尝试对数据新闻生产过程的著作权侵权风险进行探析并提出数据新闻生产过程中文本和数据挖掘的著作权侵权例外制度,应能对新闻理论和实践发展有所助益。二、文本和数据是数据新闻的资源基础

    数据新闻的概念诞生于新闻实践。数据新闻研究的奠基作品《数据新闻手册》将其概括为用数据处理的新闻。数据新闻让传统的“新闻嗅觉”和有说服力的叙事能力与大量的数据信息相结合,成为一种可能。[2]国内关于数据新闻比较有代表性的观点认为,所谓数据新闻,即将数据及数据技术应用于新闻生产流程中,以可视化技术来呈现新闻[3];是基于数据分析和计算机技术的可视化新闻样式,在新闻叙事中使用数据呈现原本仅靠文字所难以呈现的内容;或者通过数据分析发现问题,进而挖掘出新闻故事[4]。以上关于数据新闻的概念或定义之间虽有差异,但其本质都包含了对数据的收集、挖掘和分析。

    数据新闻一般也被称为数据驱动新闻,也就是说,数据新闻的基础和其生成的动力来源于数据的获取与挖掘。对数据新闻中的数据我们应从广义上进行理解,总体来说,符合新闻选题,可用于新闻分析的文本、数字、图画、音频、视频、数据库及其他资料都属于数据新闻中的数据资源,这些资源又往往是著作权保护的对象。实践中我们将对此类数据资源进行挖掘的行为称之为“文本和数据挖掘”(Text andDataMining,TDM),文本和数据正是数据新闻的资源基础。三、数据新闻文本和数据挖掘中著作权认知与制度不足

    数据新闻生产过程中进行的文本和数据挖掘的对象,有可能受到著作权法等保护。对此类对象的使用,除非有法律明确规定外,应当取得权利人的授权并支付相应的报酬,否则,即涉嫌侵权。因此,数据新闻生产的主要侵权风险即为对文本和数据挖掘行为侵权与否的不确定性,具体体现为法律风险意识缺失,包括公众习惯并认可网络资源的“免费”使用及“新闻”不受著作权保护,和现行立法中数据新闻文本挖掘行为性质并无清晰界定。

    (一)网络环境下“免费”使用的惯常思维

    我国的著作权法诞生于前网络时代,其制定之时的信息传播技术背景决定了其难以对互联网时代的传播行为作出有效应对。2001年的著作权法为因应加入世界贸易组织而作出的变革,虽对互联网传播发展带来的挑战有所回应,但规定较为粗疏;2010年的著作权法修订,也只是针对非法作品而对著作权保护的作品范围进行调整。社会公众在著作权保护意识不强的背景下陡然进入互联网时代,仿佛进入了一个对知识产品自由共享的空间,将互联网上未经许可的作品传播视为理所当然。最高人民法院在对网络转载摘编作品的行为性质认定上也经历了从不侵权到侵权观点的改变,反映了最高司法机关对于网络上转载行为的性质认定的理解,也是一个逐步深入的过程。这折射出国家对版权法哲学价值中功利主义价值和自然权利价值不断博弈选择的过程[5]。加之因为著作权权利保障不到位,现实生活以及网络环境中,大量的著作权侵权行为并没有受到处罚,这也难免使公众对自己刚刚萌生的著作权认知和保护意识产生质疑,甚至对著作权制度的正当性和效用产生疑虑。因此,在涉及享有著作权作品的使用时,“拿来主义”就显得较为自然普遍,且当他人对此类使用行为因其侵权进行质疑时,也颇不以为然。

    (二)“新闻”不受著作权法保护的一般误解

    新闻是文本和数据挖掘的主要对象之一。新闻不受著作权法保护是一种具有一定普遍性的认识。相应的,在进行文本和数据挖掘时也会将有关新闻作为可以自由使用的对象,这往往是将新闻作品混同于时事新闻。我国著作权法不适用于时事新闻。最高人民法院《关于审理著作权民事纠纷案件适用法律若干问题的解释》第16条将“时事新闻”认定为“通过大众传播媒介传播的单纯事实消息”。此类事实消息,往往用语简要,且只是反映了事情发生的基本要素,什么时间什么地点何人发生了什么事,缺少任何要素信息都无法使受众理解基本事实发生的时空和情形,并且往往具有较强的时效性。因此,著作权法将其排除出保护的对象。但需要说明的是,即使著作权法对此做出了明确规定,但对于时事新闻的判断以及是否保护的问题仍存在很多不同观点。如“时事新闻”的时效性是个伪命题,据此所作的司法判决当然也缺乏合理性[6]。著作权法不适用于时事新闻的规定并无必要。它不仅与《著作权法》第五条的立法价值不符,也与日常生活中的一般理解存在出入,极易导致实践中的混淆[7]。加之现实生活中公众对新闻的需要,以及媒体对新闻质量的要求,更多的新闻报道已经远远脱离了单纯的事实消息的范畴,其更具有思想性、可读性,其社会价值并不亚于其他的一般作品等。因此,将新闻作品等同于时事新闻的误解,并且在文本和数据挖掘过程中进行未经许可的使用,增加了数据新闻生成过程中的潜在法律风险。

    (三)数据使用生产中著作權限制情形的制度供给不足

    对文本和数据进行挖掘是数据新闻生产的必要行为,对其性质著作权法律法规并没有进行明确规定,只能根据具体文本和数据挖掘的具体情形对其进行个案分析。我国在著作权法中有关新闻作品的具体规定体现在著作权法中关于合理使用和法定许可的有关规定中,这契合了新闻作品本身的公共传播性、时效性等。

    为了保障新闻信息的传播和公众的信息获取利益,著作权法规定了报纸、期刊、广播电台、电视台以及信息传播中为报道时事新闻的合理使用。实践中出现的立论与其他新闻作品的“引用式”的数据新闻,往往是对其他新闻做出少量修改与装饰而生成,这种形式对原始新闻是否构成侵权,还有赖于对现有法律做出尽可能清晰的定义。[8]从关于新闻合理使用的规定来看,是不是构成侵权,或者构成合理使用与否,其关键点即在于如何理解“不可避免地再现或者引用”。加之合理使用的具体行为也受制于“再现或者引用”,这种判断的模糊性及具体使用行为的限制,不能满足大数据背景下数据新闻数据挖掘、分析以及展示的需要。除合理使用外,著作权法还规定了报刊转载和摘编法定许可转载和摘编。转载的法定许可具有明确的主体限制,即报刊之间,而不包括报刊与广播、电视之间,亦不包括报刊与网络媒体之间,加之具体“转载”和“摘编”使用情形的限制,决定了此种使用方式的限制对数据新闻的生成过程中文本和数据挖掘的数据分析行为,其适用空间不大。

    综合著作权法关于合理使用和法定许可的规定,其规定情形并不足以解决数据新闻生产对类似文本和数据抓取行为性质的困惑,有赖于法律法规做出进一步的明确界定,抑或从另一个角度考虑,将此类文本和数据挖掘利用行为进行著作权侵权的限制规定或者将其纳入合理使用的范畴,以有利于数据新闻的生产。四、文本和数据挖掘著作权限制的域外探索

    (一)数据的著作权权利保护与数据挖掘著作权限制的平衡

    对数据材料涉及的著作权和数据库权利等进行保护是在大数据和网络时代仍然应当坚持的。但在大数据及网络时代,对作品和数据的利用和传播方式发生了彻底变化。数据新闻也正是在这种背景下结合传统新闻的特点,应运而生。数据新闻作品利用的便捷性使公众对信息获取的需求性以及获取的及时性得到了满足,在此基础上,更要保证公众对信息的获取可能性和信息质量的提升,在保护权利人著作权与公众信息获取之间不断进行着调适和平衡。就版权的本质而言,版权并不是作者的一项自然权利,而是法律基于特定的政策目标进行的制度调适,它的核心并不是对作者权利的绝对保护。就使用者角度而言,基于版权的政策目标,亦应使使用者学习、欣赏作品的需求得到满足,保障其基础作品的权利,这也是人类文明发展的必然需要。据此角度,甚至可以将版权保护的本质定位为对使用者权利的保障。在我们强调对作者权利保障的同时,基于公共政策的目标,使用者的权利同样重要。援引版权法合理使用规定并没有侵害作者或版权人的权利;实际上,版权的目的在于增进知识从而有益于社会福利,这也正是恰当运用合理使用的目的[9]。

    文本和数据挖掘限制或例外正是在此背景下,对著作权权利平衡做出的新的尝试,这也为数据新闻生产过程中对文本和数据挖掘行为减少了法律不确定性或扫除了法律障碍,以进一步促进媒体融合的发展。

    (二)欧盟对数据挖掘著作权限制的探索

    文本和数据挖掘是大数据发展所必需,也是数据新闻生产过程所必要,这涉及对享有著作权的作品和数据库等的利用。对于这种利用是否构成对著作权及数据库权利的侵犯,存在不同意见,法律上的不确定性对数据新闻乃至内容产业发展具有负面影响。就理论上而言,著作权保护的是作品的独创性表达,并不保护其中的事实、数据等,因此文本和数据挖掘对作品的使用似乎并不会侵犯著作权。然而,在文本和数据挖掘的过程中会涉及一系列的技术行为,包括复制等。这些行为会涉及需要著作权人的许可,由此在现有法律框架下直接进行的文本和数据挖掘行为,有可能导致侵权。

    为应对这种状况对大数据发展、内容产业及著作权保护产生的重大影响,近年来欧盟一直在立法方面积极努力。欧盟议会于2019年3月26日通过《单一数字市场版权指令》,该指令第2条将“文本和数据挖掘”定义为“任何旨在分析数字形式的文本和数据的自动分析技术,以便生成包括但不限于模型、趋势、相关性等在内的信息”。该版权指令的第3条至第6条规定了四项新的版权例外情形,拓展了合理使用的空间,其中包括文本和数据挖掘的版权限制情形。

    版权指令为了给科学研究拓展大数据利用的空间,将以科学研究为目的的对合法获取的作品或者其他内容进行复制与提取的文化和数据挖掘行为规定为著作权权利的例外,为研究人员的研究行为提供了更多的法律确定性。文本和数据挖掘是一个自动化过程,它允许通过高速机器读取大量数据和文本来收集信息。版权指令新增的文本和数据挖掘的版权限制将简化大学和研究机构的版权许可负担,允许其基于科学目的合法地使用自动化技术分析大量数据,从而服务于科学探索和创新。新规定还允许研究人员将这项技术应用于其研究组织已订阅的大量科学期刊,而无需为文本和数据挖掘行为申请授权。因此,版权指令将推动欧洲顶尖研究的发展。版权指令还包含了文本和数据挖掘的另一个更具普遍性的例外,即要求成员国在其本国法律中实施不仅限于研究目的的例外。该条款将适用于所有公众可合法访问的内容,包括在线公开的内容。新规定包括为了市场研究、机器学习和调查性新闻等目的在内的例外,允许通过互联网对内容进行的数据分析,这将促进欧盟数据分析和人工智能的发展。本条的规定也为近年来兴起的数据新闻减少了法律障碍,有助于这种新的新闻形式的发展,可资参考。五、数据新闻中文本和数据挖掘著作权限制制度的构建

    我国在2015年发布了《促进大数据发展行动纲要》(以下简称《纲要》),提出未来5至10年我国大数据发展和应用应实现的目标[10]。《纲要》的发布意味着中国大数据发展迎来顶层设计,正式上升为国家战略。这对我国未来相关产业的发展将带来深层次的影响,对与此有关的新闻行业同样影响深刻。但与数据新闻生成过程中对原始文本和数据的挖掘行为在法律上的定性与著作权侵权与否却并无清晰认识。目前我国正在进行著作权法的修订,目前公布的第三次送审稿显示,其中并无关于文本和数据挖掘等与大数据发展相关的内容。这一是与大数据发展的形式并不匹配,会造成法律尚未通过但已经落后于社会实践的尴尬状况。二是与数据新闻发展以及媒体融合趋势不能匹配,致使未来新闻重要形式的数据新闻发展具有侵权的法律风险隐患。为此,应把握著作权修法契机,深入研究文本和数据挖掘在我国著作权立法中作为著作权限制或例外的可行性,以配合适应我国的大数据国家战略及相应产业的健康发展,也会为数据新闻中必备的文本和数据挖掘行为拓展空间。