返回上一页 文章阅读 登录

丁晓东:数据到底属于谁?

更新时间:2019-10-28 22:26:03
作者: 丁晓东  
还需要对个人数据的自由流转提供帮助。《一般数据保护条例》规定,“数据主体有权获取其提供给控制者的相关个人数据”,而且,这种个人数据格式应当是“经过整理的(structured)、普遍使用的(commonly used)和机器可读的(machine-readable)”,数据主体有权“从其供给的一个控制者那里无障碍地将此类数据传输给另一个控制者。” 按照这一数据权利,个人甚至可以要求微博对其他平台开放端口,以实现其个人数据的自由移转。

  

   (二)数据平台所有

  

   数据权属的第二种类型或观点是数据属于平台。此种观点最为典型的是今日头条与微博之争爆发后微博所发布的新用户协议,该用户协议规定,“用户在微博上发布的信息,包括但不限于文字、图片视频、音频等,不论微博内容是否构成著作权法意义上的可保护客体,用户同意不可撤销地授权微博平台作为微博内容的独家发布平台,用户所发表的微博内容仅在微博平台上予以独家展示”。 这一新用户协议实质上将数据的权属界定为平台所有,排除了用户对于微博内容进行再次授权使用的权利。

  

   可以想见,数据完全归属平台的观点并不受欢迎。在微博发布新的使用协议后,这一协议就受到了用户与媒体的猛烈抨击,而微博也对这一新的使用协议进行了澄清,并且修改了用户使用协议。更新后的用户协议规定,用户对于其所发的内容拥有版权与著作权,微博作为发布平台只享有一定范围的使用权。用户对于自己具有完全权利的内容可以根据自己的意愿发布到其他平台,无须微博批准、审批、同意。但即使如此,更新后的用户协议仍然强调,未经微博平台同意,自行授权、允许、协助第三方非法抓取已发布的微博内容,仍然属于违法。 因此,调整后的微博用户协议意味着微博不享有相对于用户的数据权利,但享有相对于其他平台的数据权利。

  

   (三)数据个人与平台共有

  

   数据权属的第三种类型或观点是数据属于个人与平台共有。在中国法院的判决中,这是较为常见的一种观点。例如,在新浪诉脉脉一案中,法院认为,数据开放的前提是必须获得用户个人与平台的同时授权。而且,法院为了强调个人数据保护的重要性,还提出了“用户授权”+“平台授权”+“用户授权”的“三重授权”模式,即数据的提供方首先取得用户同意而收集数据,在数据提供方向第三方平台授权使用此类信息时,第三方平台还应当明确告知用户其使用的目的、方式和范围,再次取得用户的同意。 法院的这一判决理由意味着,个人和平台对于数据都拥有一定的权利主张,数据在一定程度上为个人与平台所共有。

  

   当然,在数据个人与平台共有的情形中,个人与平台的权力划分与权利边界仍然是一个问题。在具有竞争关系的网络平台进行爬虫时,双重授权或三重授权的规定具有较强的合理性,而且也具有较强的现实操作性,但在其他场景下,要求平台与个人进行双重授权或三重授权可能会面临种种困境。例如,个人将平台的数据用“复制—粘贴”的方式大量拷贝到其他平台,此种行为显然没有获取平台的授权,但此种行为是否违反了数据的共有产权?此外,当平台所属的网络发生产权变更时,此时产权的变更是否需要获取用户同意?2018年,人人网被出售给多牛传媒公司,其出售的资产包括了用户数据,但在这一出售过程中,人人网并没有履行征求用户同意的环节。无疑,要求人人网出售前征求所有用户的同意,这并不现实。

  

   (四)数据公众所有

  

   数据权属的第四种类型或观点是数据属于公众所有。这种观点认为,一旦平台介入互联网,就意味着平台数据具有了公共属性,不为任何私人或企业所有。在上文提到的HiQ诉领英案中,HiQ公司聘请了哈佛大学法学院的劳伦斯?却伯(Laurence Tribe)教授作为顾问,却伯教授认为,数据与信息的访问权是一种言论自由的权利,受到美国《宪法》第一修正案的保护。根据这种观点,数据的本质其实是一种言论,而言论的本质就是流通与共享,具有公共属性。因此,对数据的抓取就不需要网络平台授权或个人授权。

  

   对于互联网的公共属性,网络法学者奥林?科尔(Orin Kerr)教授曾经有过经典描述。在他看来,互联网的一般原则是开放性,这种开放性允许世界上任何人发布信息或数据,数据可以被任何人访问,而无须进行身份验证。当计算机所有者决定在其机器上设置Web服务器,使文件可以通过Web访问时,这就推定了大众都可以访问这些文件。 科尔教授还打了一个比喻,把网络服务器连接到互联网就像在公开交易会上出售商品,任何人都可以访问网络上的数据或交易会上的商品。 只有在比较特殊的情形下,例如当网站设置密码时,网页才会从开放网页转化为封闭网页。

  

   我国的互联网评论家方兴东曾表达过类似的看法。方兴东认为,从互联网的前身阿帕网(ARPAnet)到后来的TCP/IP协议,以及一系列网络治理机制和技术标准组织,“都坚定地确立了互联网开放、共享、自由、平等的核心价值观和技术规则”与“无歧视、无选择、无条件的互联互通”。但当前中国互联网行业对数据与流量却采取了越来越多的“高筑墙”行为。因此,方兴东认为,无论是淘宝拒绝百度搜索店铺页面信息,百度试图通过Robots协议拒绝360搜索的“3B大战”,微信频频对滴滴、淘宝、今日头条、抖音等竞争对手进行选择性的屏蔽,还是百度大规模自我导流,甚至不再显示搜索结果中外部网站的地址,都与互联网的精神背道而驰。

  

三、数据权属:法律条文与教义分析

  

   平台数据权属的四种观点哪个更有道理?对此我们可以首先从法律条文与法律教义的角度分析个人数据权利与企业数据权利的界限,而这种分析将表明,个人数据与企业数据的权利界限均不明确。

  

   (一)个人数据权利

  

   首先,个人数据的范围、个人数据权利均存在很大的不确定性,这使得平台数据中的受保护的数据范围存在不确定性。本来,中国与世界其他各国的法律都规定了个人数据保护的法律,企业、社会与政府也都对个人数据保护的优先性具有一定的共识。例如,在腾讯与华为数据之争、菜鸟与顺丰数据之争、今日头条与微博数据之争等案例中,各方都视个人数据保护为重中之重,各方都强调获取用户的授权。但问题在于,用户在平台上所生产的各种数据是否属于个人数据?在不同应用场景下的个人数据是否都应当受到同等程度的保护?

  

   按照个人数据或个人信息的通行定义,个人数据或个人信息为已识别个人或可识别个人的数据。 例如,我国《网络安全法》规定个人信息是指“以电子或者其他方式记录的能够单独或者与其他信息结合识别自然人个人身份的各种信息。” 欧盟《一般数据保护条例》将个人数据界定为“任何已识别或可识别的自然人相关的信息”。 但按照这一通行的定义,网络平台的各类用户所产生的数据却既可能属于个人数据,也可能不属于个人数据。这是因为,平台的用户数据既可能直接识别个人或结合其他信息间接识别个人,也可能基本无法识别个人。是否可以识别个人,这高度取决于具体应用场景、识别主体与识别难度。 以平台的用户评论数据为例,此类数据在平台上匿名化显示之后,对于一般人可能难以识别。但如果结合该用户的其他购买记录、行踪轨迹等信息之后,此类数据就有可能变成可以识别个人的数据。而对于该用户周围的人群来说,甚至可能单凭一条用户评论就可以识别个人。

  

   此外,个人数据权利的边界也存在不确定性,个人很难确立对于自身数据的排他性权利。数据隐私的思想创立者阿兰?威斯丁(Alan Westin)曾经将数据隐私或信息隐私界定为个人对于信息的控制。 这一思想框架后来被各国与各地区的立法所接受,构成了当前各国各地区的数据隐私法的基本思路。 但问题在于,在不同国家和地区、不同场景下,法律对个人进行数据赋权的差异巨大。法律可能赋予个体数据访问权、数据安全权等权利, 也可能赋予上文所提到的被遗忘权、数据携带权等新型权利。无论是各国之间还是专家学者都未对此问题达成共识。

  

   个人数据的这些不确定性特征使得个人数据与企业数据的权利边界变得难以划分,甚至使得一些初看上去较为明确的划分也可能会面临质疑。例如,在关于企业数据的研究中,不少研究将数据区分为原始数据与加工数据,认为原始数据常常包含个人数据,而加工数据则由于加工和去标示化而不再属于个人数据。例如基于个人数据而进行统计的数据,人们常常会认为其不属于个人数据,其权属应当属于企业。但此类区分还是会面临一些挑战。如果赋予个体数据删除权,个体要求彻底删除其个人数据,或者个体明确要求撤回对其个人数据的处理,那么企业基于原始数据而得出的加工数据或统计数据可能就会面临争议。

  

   (二)平台数据权利

  

   就平台的数据权利而言,对照各国法律对于企业数据的保护,可以发现各国法律与法律教义对于平台数据的保护也存在很多争议,对于平台数据权利的边界不具备共识。

  

   首先,数据库法律保护与知识产权难以为平台数据权利划定边界。从性质上看,平台数据最接近于数据库,都是海量数据的集合。但对于数据库的保护,各国首先就有很大的分歧。美国的数据库保护只涉及数据库中的原创性汇编的要素,对数据库中的事实部分,法律不加以保护。在费斯特(Feist Publ’ns, Inc. v. Rural Tel. Serv. Co.)案中,费斯特在未经许可的情况下将一本电话号码汇编全部进行了拷贝,对于此种行为,美国最高法院认为,此种行为并不违反版权,版权只保护对数据进行原创性汇编的部分,不保护事实。 而与美国做法不同的是,欧洲除了对数据库的原创性汇编部分进行保护之外,也为数据库的特殊权利(sui generis rights)提供保护。 根据这一特殊权利保护的规定,当“创造数据库需要足够的人力、技术和财政资源”时,数据库就受到法律保护。 一旦数据库被创造出来,他人就不得使用或复制数据库的全部数据或大部分数据。

  

知识产权与相关法律之所以对数据库权利存在分歧,其中重要原因就在于数据的多重属性。一方面,数据库的制作者无疑对数据的收集与编排付出了大量的工作。从劳动创造财产权的经典理论出发, 数据库理应得到财产权或类似于财产权的保护。在美国历史上,下级法院也曾经在判决中认同了“额头汗水(sweat of the brow)”或 “勤劳收集(industrious collection)”的教义,认为如果数据库制作过程中对数据收集付出了大量劳动,那么它们就应当得到法律保护。 但另一方面,数据又具有非常强的公共属性,并非付出了劳动,数据本身就应当变成法律上的私有财产或知识产权。因为相比起其他动产或不动产,数据具有明显的非排他性与非竞争性:数据很难为个人所独自占有,(点击此处阅读下一页)


爱思想关键词小程序
本文责编:limei
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/118748.html
文章来源:《华东政法大学学报》2019年第5期
收藏