返回上一页 文章阅读 登录

余成峰:从大数据神话拯救隐私

更新时间:2022-01-13 00:32:29
作者: 余盛峰 (进入专栏)  
通过无与伦比的存储能力和计算能力,主要基于对历史行为的估算学习来展开对未来的概率预测。

   现代性的哲学、政治和法律概念立足于人的自由意识,包括精神、心灵、自主与隐私等概念。换言之,个体心理系统作为现代性最宝贵的主体资源,有赖于隐私保护来确立法律人格与社会的边界。此种主体心智隐私不仅是新教伦理与资产阶级理性的基础,同时也是现代科学发现和法律沟通的前提。而大数据的智能形态及其知识生产机制,则与此种以人类主体意志为中心且意在保护人格资源的现代法律逻辑产生冲突。在这种背景下,大数据技术正开始瓦解现代权利的隐私根基。因为,近代隐私权立足于个体意识与自主理性,由主体控制其信息边界从而捍卫基本权利的完整性。然而,大数据智能的运行模式,则在很大程度上取代了主体自主理性发挥的空间,使信息决策权从理性个人转向匿名的算法系统,这构成了对传统隐私哲学假设的严峻挑战。

   传统隐私权围绕主体之间的信息沟通及其冲突模式展开,隐私侵权是特定主体对其他特定主体信息边界的侵入,在其背后可以寻找出明确的侵权因果关系。而大数据技术则无需因果关系的行动管道实施物理意义上的干预或伤害。相反,只需要信息常规的搜集、组织、处理与挖掘,通过相关性模式的提取、预测和应用,就足以影响、引导乃至支配主体的行动选择。

   在美国法学家朱丽·科恩(Julie Cohen)看来,大数据绝不只是对数据的简单挖掘,在相关性模式识别的背后,实际预设了相应模式选择的价值理由。在每个数据源采集伊始,就已隐含了有关数据内容与类型化的选择偏见。机器学习之父汤姆·米切尔(Tom Mitchell)同样指出大数据的一系列设计问题:特定算法与特定问题及其表征的对应关系是如何建立的?需要何种规模的训练数据?学习假设和假设空间应该基于何种经验进行定位?选择后续训练经验的最佳策略是什么?此种选择策略又会如何改变学习问题的复杂性?

   毋庸讳言,数据本身并不具备因果关系表述的能力,它充其量只能对静态世界的概率分布进行编码。而从根本上说,任何大数据在理论上也只能是无限数据总体中抽取的有限样本。图灵奖获得者珀尔(Judea Pearl)因此认为,深度学习不过只是对柏拉图洞穴比喻中墙壁投影活动的预测,大数据无法观察到这些阴影其实只是三维物体的空间运动在二维平面上的投射。

   科恩进而指出,大数据作为当代调制社会(The Modulated Society)的知识引擎,已不再是技术中立的,作为配置与攫取消费者剩余,以及风险管理、分配与定价的工具,其正当性亟须接受拷问。易言之,大数据作为一种社会技术和制度技术,业已与经济系统、政治系统以及法律系统形成紧密的耦合关系,它以其自命精准的算法判断主体的偏好,同时又以自己推断的模式反向塑造和调节此种偏好。正因如此,大数据已不只是对数据的简单挖掘,不只是对数据隐藏知识的提炼,它同时也是影响深远的行为主义社会实验,是当代最为激进的社会物理学工程。信息资本主义的大数据战略,有可能将现代主体改造为算法预测指导的路径依赖主体,从而迥异于近代印刷术时代锻造的启蒙隐私主体。

   与此同时,大数据的广泛商业化应用,意味着人类主体研究的私人化趋势,对此也尤其缺乏制度、程序以及伦理层面的防护措施。正如帕斯奎尔在《黑箱社会》中所说,大数据所承诺的“计算社会科学”可能演变为系统压迫的工具。它们将主观偏见伪造成看似中立的分数,从而成为分配机遇和施加惩罚的仲裁者。由于算法系统将人看作数据点的集合,受此影响的人将不再被当作独立个体来对待和理解。在此意义上,隐私保护所捍卫的人格独立与离经叛道,恰与大数据对于可预测性和行为模式趋同化的追求形成对立。

   在一个运行良好的社会,其理性形式和知识类型应当是多元而制衡的。换言之,占卜理性、科学理性与大数据理性作为人类社会的不同认知模式,理应占据各自的生态位,从而形成丰富的心智形态。而大数据神话的盛行,则可能经由资本和权力之手的联盟,悄然取代其他各种知识类型、智慧观念与理性动机,蜕变为某种霸权意识形态,进而威胁现代文明的深层基因。与流行的观点不同,科恩认为大数据而非隐私保护才构成创新的阻碍,因为大数据理性对于既往行为模式的全然顺应,对于个体偏好的标准化塑造,可能扼杀创新所倚赖的各种机缘巧合与零敲碎打。如果说数据即事实,那么创新所需要的恰恰是一种反事实、反数据的虚构想象力(would haves),它所提供的不仅是灵活性和适应性,更重要的还包括持续的反思能力以及反其道而行之的打破现状、勇于承担道德责任的能力。人类的因果观察、行动干预以及反事实的建构能力,是一种独特的心智天赋,由此进一步孕育出共情、信任、远期预测和自制能力。在原因与结果的繁复网络中,这种天赋能够帮助人类跨越漫长的历史时间线,超越当下的利益结构和视野偏见,而这尤其依赖于隐私保护所提供的心智容器。

   大数据技术的兴起有其社会根源:可选择性的不断增加造成了决断的困难,必要时,放弃选择的权利,将选择交由机器完成,以此降低自主决定的成本与风险,将风险预测和成本管理交由大数据之手,可大大减轻沉重的决策负担。但是,在理性意识、心理意向、主体智能、自主权利与隐私保护之间,实际存在着深奥而隐秘的关联。换言之,保护隐私也即保护人类特有的心智类型和人性尊严。

   正因如此,只有在隐私的边界之内,才能为浮面的数据和信息提供具身性的意义框架,为主体的道德判断与商谈沟通提供可能,为创造各种不同的“假如世界”提供灵感的避风港。而当大数据理性成为社会的凌驾性标准,就可能排斥人类心智的参与和干预,逐渐将现代启蒙主义的因果理性传统边缘化,从而成为人类隐私被机器监控全面吞没的前奏。当理性的定义逐步改变,人类的心智隐私可能也将随之消亡。

  

  


爱思想关键词小程序
本文责编:admin
发信站:爱思想(http://m.aisixiang.com)
本文链接:http://m.aisixiang.com/data/130895.html
文章来源:《读书》2022年1期
收藏