返回上一页 文章阅读 登录

丁晓东:数据到底属于谁?

更新时间:2019-10-28 22:26:03
作者: 丁晓东  

  

   企业或平台数据权益也更宜采用场景化的保护进路。在关于数据爬虫争议的司法实践中,中国与美国所援引的法律依据有些差别。中国的法院更多采取了以竞争法的方式保护平台数据,而美国的法院则更多诉诸英美法与制定法上的非法侵入(trespass)。但二者在场景化保护这一点上其实具有相似之处。我国竞争法的保护方式非常强调个案判断与不同案件的类比推理,强调从个案中提取和制定规则,而不是从统一规则中寻求法律答案。而美国法上的非法侵入概念也同样非常依赖于具体场景,何谓非法侵入,何谓对数据的合理访问与利用,这取决于具体场景与具体个案中的多种不同因素。

  

   从法理上说,对平台数据权属采取场景化的保护,这实际上是以理性规则(rule of reason)——而非规则本身(rule per se)——来对数据权利问题进行判断。对于法律争议,传统的法律领域常常强调法律规则的重要性,主要通过规则与例外规则的设定来划分各方的权利边界。但在竞争法、反垄断法等领域,国外的法律更多以理性规则与个案判断来确定各方权利。 之所以以这种方式来设定各方的权利义务,其原因在于此类问题的争议往往更依赖具体场景(context-specific),更难依赖脱离场景的规则来进行确定。就数据而言,由于数据问题的高度场景化特征,采取理性规则无疑将更有利于对个人数据和企业数据进行更为合理的保护。

  

   (二)数据权属界定的因素考量

  

   在实体问题判断中,平台数据权属的场景化界定需要考虑一系列因素。第一,应当将数据隐私保护作为最为重要的考虑因素之一。在数据隐私会给个人带来较大风险或打破个体合理预期的情形下,应坚持数据隐私合理保护相对企业数据权益的优先性。这是因为,一旦个人数据隐私得不到合理保护,不但个人的合法权益无法得到保障,企业也会丧失来自用户与消费者的信任。

  

   第二,在保障个人数据隐私的前提下,应注重促进数据的共享与互联互通。数据的共享与互通不但无损于数据本身的价值,而且更可能发挥数据的规模化优势,真正发挥大数据的功能,并为人工智能产业提供坚实基础。毕竟,所谓的大数据,其最主要的特征就是“高容量, 快周转、 多种类”,  离开了数据的共享与流通,大数据以及人工智能的发展就是无源之水。

  

   此外,我们更要认识到数据共享与流通的国际战略意义。在可预见的将来,中国互联网企业必然会逐步进行海外拓展,而在这种拓展过程中,数据的获取与使用必然是重要的战略环节。制定符合数据特征的数据共享与流通制度,将有利于中国互联网企业在东南亚、一带一路等国家的战略布局。

  

   第三,应根据爬虫平台与被爬虫平台的性质、爬虫行为的特征等因素来确立不正当竞争与合理使用的边界。就爬虫平台一方而言,当爬虫平台一方具有公益性或具有公共基础设施的性质时, 应当更多允许爬虫平台进行数据爬虫。例如,对于搜索引擎的数据爬虫,美国与欧盟等地区都确立了对于搜索引擎的数据开放立场,即使对于受版权保护的信息与数据,搜索引擎对其的数据爬虫行为也被认为属于合理使用的范围, 因为搜索引擎具有信息公共基础设施的性质,搜索引擎的数据爬虫无疑有利于数据的公共传播与利用。

  

   而就被爬虫平台的一方而言,应当考虑被爬虫平台一方的数据体量与数据性质。当被爬虫的一方数据体量巨大,而其中的数据又属于原始数据或基础数据时,此时应当更多允许第三方的数据爬虫与数据合理使用。这是因为,当超级网络平台收集海量数据后,此时数据的潜在垄断就会成为可能。如果赋予此类平台过强的数据保护,其结果就可能出现所谓的数据割据或数据封建主义,无法实现数据共享与数据的普惠性。在数据库的例子中,这样的问题已经出现。在美国与欧洲,一些学术数据库巨头掌握了学术论文的垄断性,要想查看论文常常需要花费不少的金额; 在中国,由中国知网(中国期刊全文数据库)所引发的垄断问题也引起了越来越多的批判。 如果数据资源不能实现总体性的开放共享与有序流通,那么中小型互联网企业就会面临数据壁垒,互联网领域就无法形成有效的竞争。

  

   就爬虫性质而言,在其他因素相同的情况下,当某个平台爬虫后将数据用于和被爬虫平台类似的商业场景中,此时应当倾向于认定数据爬虫的不正当竞争;而当数据爬虫的目的是为了对数据进行进一步处理或在其他场景下对数据进行利用,此时应当倾向于认定数据爬虫的合理使用。这是因为,前一种行为并没有对数据进行创造性的利用,也没有为消费者提供差异化服务,其对数据的爬虫完全是一种搭便车行为,不利于构建良好的市场竞争环境。相对而言,第二种数据爬虫行为虽然也具有搭便车的因素,但鉴于数据较强的公共属性和此类服务的创新和差异化服务,此时应当更多倾向于认定数据的合理使用,或者应当更为慎重地认定为不正当竞争。

  

   当然,确定数据爬虫属于不正当竞争还是合理使用,需要考虑的因素还远不止以上因素。例如,还需要结合具体场景中的商业习惯与行业惯例来判断企业的合理预期。这些多种因素的判断无疑给司法与法律判断增加了难度,但从另一个角度来看,多种因素的综合性分析将使得司法对此问题的分析更为全面与融贯,更能符合法律的整体性解释。

  

六、结语

  

   对于由平台数据爬虫而引发的数据权属问题,可以归纳为四种观点:平台数据属于个人所有;平台数据属于平台所有;平台数据属于个人与平台共有;平台数据属于公共所有。但本文研究后发现,从法律条文的角度分析或从法律教义的角度分析,无论哪种观点都无法得到支持。从后果主义的角度分析,也可以发现无论把平台数据配置给哪一方都不合理。

  

   平台数据的权属之所以无法明确界定,关键在于数据具有多重性质,而其性质又往往依赖于具体场景。在有的场景下,平台数据属于个人数据范畴,需要数据隐私法的优先保护;在有的场景下,平台数据具有类似数据库的性质,需要类似数据库权益的保护;而在其他场景下,平台数据又具有公共性,需要法律保障数据的共享与流通。

  

   从数据的多重属性与场景化特征出发,需要确立数据的场景化保护与场景化确权。无论是个人数据保护还是企业数据权益的合理保护,都需要注重通过自下而上的个案来推动数据保护规则的制定与演进,而非过于依赖自上而下的规则制定。就法理而言,这意味着对数据权利应当基于理性规则进行确定,而非寻求放之四海而皆准的统一规则。

  

   在实体判断层面,平台数据权属的界定需要考虑多种不同因素,既需要考虑数据隐私的优先保护,考虑合理保护平台数据权益,又要特别注意促进数据的共通共享。既需要考虑数据领域的搭便车行为与不劳而获,又要注重数据的公共性。既需要防止平台的不合理竞争,又需要防止数据垄断与数据壁垒。如此,互联网才能实现数据的合理流通与合理保护的双赢。

  


爱思想关键词小程序
本文责编:limei
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/118748.html
文章来源:《华东政法大学学报》2019年第5期
收藏