返回上一页 文章阅读 登录

周林彬 马恩斯:大数据确权的法律经济学分析

更新时间:2018-09-28 07:34:47
作者: 周林彬   马恩斯  

   【摘要】 大数据确权即明确大数据的初始产权界定,包括明确大数据的权利性质、权利内容和权利归属。目前学界将“大数据”、“数据”与“个人信息”混为一谈,将注意力集中到人身权、隐私权研究,既忽视了财产性才是大数据的根本属性,又忽视了大数据在挖掘、云存储、云计算和应用等方面与一般数据的诸多客观区别。由于大数据是信息时代的新产物,所以在法律性质、权利内容、权利归属方面存在着诸多制度空白,进而导致了公地悲剧、市场垄断和逆向选择等负外部性的出现并阻碍社会福利最大化的实现。可以通过法律经济学对大数据确权进行比较制度分析,以解决大数据初始产权的界定问题。

   【中文关键词】 大数据;云计算;产权;法律经济学

  

一、什么是大数据

  

   法律视角中,什么是大数据?大数据和普通数据有什么区别?目前理论[1]、实务界[2]与立法者[3]出于现实考虑,默契一致地选择回避正面回答“什么是大数据”,而是采用了描述性的概念界定即众所周知的“4V标准”[4],将“大数据”定义为“大量(普通)数据的集合”。这样定义的优点是解释力强,符合法理学常识中的“法律原则的抽象程度与解释力成正比”,但缺点是“法律原则的抽象程度与可用性成反比”。“4V标准”的解释力与实用性相悖,将大数据与普通数据的区别定位为数量而非性质上的区别,进而导致大数据在世界范围内被拖入隐私权争论的泥淖之中——“既然归根结底是一般数据,当然应该参照个人信息保护规则”。同时也既无法被民法典或其他立法直接采纳也难以被司法直接适用。但“法律视角中,什么是大数据”是不应也不能闪烁其词的。不清楚大数据在法律上是什么,何谈确权?如何流转?如何保障?后续的法律和法律法规如沙滩城堡,如何稳定?

   笔者认为,大数据是依确定目的而挖掘、处理的大量不特定主体的数字信息。

   概念的提出是从“大数据”概念提出的背景与根本目的反推而来。大数据的重大意义已不需赘言[5]。但究其根本,大数据技术、大数据服务和大数据产业的根本目的在于精确预测{1}2。通过随机分析、回归分析等统计工具和计算机算法实现对个人、企业、政府或国家行为与效果的准确预测[6]。该定义由三个要件构成,分别是行为要件、行为对象和对象性质。

   从行为要件来说,与一般数据不同,不具备“特定目的挖掘”主观要件和“挖掘、处理”客观要件而只是静置、沉睡的数据,种类和数量再多、处理速度和本身准确性再高也不会产生这种精准预测力,也不是“大数据”。好比档案馆,里边档案再丰富如果不进行有目的的挖掘和处理,也只是大量普通数据而非大数据。

   从行为对象来说,“大量不特定主体”有两个意群,分别是“大量”“不特定主体”。“大量”即大数据的数量级门槛,也即“多大是‘大’”。由立法界定什么是“大”的制度效率低于司法界定和私法替代{2}65-66。这一方面是由于“摩尔定律”[7]的存在,“大量”必然是个动态的概念,另一方面是由于大数据应用领域宽泛导致各行业的数据总量和标准不同。“不特定主体”是借鉴了刑法对危害公共安全罪的犯罪构成要件思路[8],目的是为了区分侵犯商业秘密和信息盗窃。

   从对象性质的角度来说,“数字信息”是“大数据”与“个人信息”的核心区别。目前,之所以欧美关于大数据的争论主要集中在宪法权利、隐私权、法律伦理等方面[9]并爆发了数次激烈的冲突{3}276-281,究其原因,主要是禀赋效应和信息不对称徒增的制度成本。而国内由于“大数据”提法的兴起与贩卖个人信息活动日益猖獗的周期高度重合、同步“流行”,使得国内舆论与研究者也将除大数据应用之外的主题放到了隐私权保障上[10],《个人信息保护法》的呼声也日益高涨[11]。但这和大数据的关系似是而非,主要是缺乏对大数据技术的进一步了解。之所以“似是”,是因为个体主义方法论下“大数据”的一切应用归根结底确是来自于具体自然人,最终也确实是应用到具体自然人,“取之于斯而用之于斯”。之所以“而非”是因为大数据要分析和处理的是海量数字化信息,个人信息并不是天然的计算机语言无法被直接运算,必须转化为数字信息才能产生最后“精确预测”的结果。这其中关于数据清洗、区块链存储、秘钥、分布式处理以及其他在大数据存储、分析的整个流程中,“个人信息”都不再以初始形式存在,大数据的内容是计算机语言表述的数字信息。

   前述定义下的法律视角中的“大数据”和“隐私”、“个人信息”、“商业秘密”、“(一般)数据”各自范畴均已界定,这是明确“大数据确权”的前提。

  

二、什么是“大数据确权”


   如开篇所述,大数据确权即大数据的权利性质、内容和归属。

   传统法经济学在产权初始分配方面侧重于以交易费用为基础分析权利的归属问题,为什么此处的确权却要论及权利的内容与权利的性质?究其原因有二,从理论的角度来看经济学研究的基本假定是“其他条件确定”,所以无论是在“公地悲剧”、“火车烧柴”,还是在“蜜蜂神话”等经典模型中,产权的具体类型与性质是确定的,学界很少探讨过度放牧是否侵害了画家的写生权,也不关注火车是否还影响了农场主的夜间休息安宁权,更不会探讨什么是农场、火车。但在大数据问题上,如前所述理论与实务界对“什么是大数据”问题浅尝辄止、贪功冒进,并不存在经典模型中确定的研究基础。从实践的角度来看,法律框架下对调整对象法律性质的界定具有实际意义,意味着不同的资源稀缺性度、不同的市场竞争条件、不同的制度成本。将大数据界定为财产权和人身权意味着截然相反的资源稀缺度,将大数据界定为知识产权或物权也意味着截然不同的制度成本,前者限制交易而后者鼓励交易。而既然探讨大数据确权的目的在于产生最有效率的制度设计思路,那么对交易成本与制度效率有重要影响的要素就应当是题中之意。故而,大数据确权除探讨权利归属问题,有必要探讨权利性质与权利内容。

   大数据确权的目的和必要性如何?从法律经济学来看,虽确权的具体目的包括鼓励创新以提高正外部性溢出、降低信息不对称的影响以满足有效需求最大化的实现等不一而足,但根本目的是为了无限接近科斯的“零交易成本世界”。大数据的一切具体应用的不二法门是开放与共享。医疗大数据应用可以降低误诊率、提高药物效用、提升整体居民健康水平,消费大数据可以促进供给侧改革的实现、发现和满足有效需求、降低库存和开发失败率、提升购物体验,金融大数据可以预防系统性金融风险、加强反洗钱效率、提高资金效率,这些都是为了降低由逆向选择、次品问题和道德风险产生的信息成本减损社会福利。大数据发展的指向应该是开放而不是封闭,是在个人权益与社会福利间谋求均衡,哪怕这种均衡不得不通过“卡尔多-希克斯最优”而非“帕累托最优”实现。

  

三、大数据的权利性质


   从确定大数据权利性质的必要性而言,探讨大数据的权利性质即将目前法律性质不明的大数据界定为物权、债权还是知识产权的交易成本最低,制度效率最高。由于不同的法律性质意味着不同的保护模式,也就意味着不同的交易成本与制度效率。由于前述已言明大数据的本质属性是财产性而非人身性,故不将“隐私权”列入大数据权利性质的讨论范畴。

   从确定大数据权利性质的可行性而言,大数据的法律性质之所以可以被选择主要是因为其性质未定。由于“大数据”是依确定目的而挖掘、处理的大量不特定主体的数字信息,显然不是天然存在而是人为加工的一种财产。故而其权利性质并不属于自然权利而是属于拟制权利。而大数据这一2012年开始“蹿红”的热点问题,2017年编纂的民法总则却对其权利性质问题刻意进行了回避[12]。究其原因,很大程度上是出于对大数据发展并未成熟与法典式立法必要的稳定性之间存在冲突,可能导致法律适用上的不当进而增加社会成本。故而其法律性质目前处于制度空白期,所以可以被选择。

   既然是财产权,权利性质又可以被选择,那么大数据应该属于何种财产权的客体?我国民法典编纂的过程中,已颁布的《民法总则》在第五章“民事权利”的第一百一十三条“民事主体的财产权利受法律平等保护”后以第一百一十四条、第一百一十八条和第一百二十三条列明了财产权利的三个主要组成部分,物权、债权和知识产权。从法律经济学来看,大数据的权利性质确定过程可以被视为一种制度选择的过程,在前述在物权、债权、知识产权这三种路径的制度竞争间进行“成本-收益分析”,得出效率最高的制度效率。

   债权路径带有明显的负外部性后果,促使垄断和不正当竞争的形成。债权路径中最主要的是通过契约意思自治来实现大数据确权,这是当前现实中最普遍的形式,比如贵阳和中关村的大数据交易中心所内进行公开交易以及企业间或企业内部进行的非公开数据交易[13]。互联网巨头正各自构建不同领域的互联网托拉斯,比如腾讯对于人们现在的衣食住行(分别对应京东、大众点评、58同城、滴滴打车)都持有相当股份,大数据确权存在制度空白的情况下,通过市场机制进行大数据交易的法律风险过高,进而导致交易成本高起。故而大数据企业选择企业机制,在关联企业内部流转大数据形成市场替代。但这种市场替代事实上是一种“数据壁垒”,导致大数据企业与关联企业得以迅速向行业垄断的方向发展。总的来说,如果过度依赖契约路径与放任大数据产权不明晰状态的持续则将产生市场失灵,其主要形态是垄断。届时小型互联网公司将不得不对大数据托拉斯缴纳高昂的市场进入税,直接损害社会福利。而微软公司的视窗系统,苹果公司的App Store都已经出现了这一问题。

   知识产权路径则面临制度需求小、负外部性大的问题。大数据在技术方面类似计算机软件著作权,目前也确实在通过这一途径实现部分财产权益保障功能。从制度需求的角度看,知识产权法主要保护的是实现大数据的外在技术,而对于大数据本身的解释力有限。其解释力主要在于大数据分析和大数据应用,因为此阶段确实包含了大数据工程师的智慧成果。但是在大数据挖掘方面则很难解释,比如Cookies(电脑上网缓存)与网络痕迹,并不包含明显的智慧加工。同时由于诸如Hadoop、HDFS、Mapreduce等主流大数据开发和处理软件为了快速普及、降低开发成本、实现行业话语等商业考量基本都采取了开源的方式,即很大程度上放弃了智慧成果的专属权。故而如前所述,在大数据挖掘方面知识产权性体现的不明显。最关键的问题是知识产权法某种程度上说是以限制应用来鼓励创新。这与数据共享和零交易成本的“互联网+”方向相左。从卡尔多-希克斯最优的角度来说,应该以补偿大数据企业及其工程师的方式限制大数据的知识产权属性。

   相较于债权、知识产权这两种路径,“物权路径”的制度效率最高,债权次之、知识产权最次。之所以“物权路径”制度效率最高,理由在于两方面。

第一是需要克服的制度禀赋难度低、制度改进成本小。若将大数据解释为一种物权客体,则现有物权体系中的无体物基本能够相融,从而更容易被立法者接受,克服制度禀赋难度较小。具体来说,物权的占有、使用、收益、处分四大权能较好对应大数据流程,(点击此处阅读下一页)

本文责编:陈冬冬
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/112548.html
收藏