吴飞 傅正科:大数据与“被遗忘权”

作者:吴飞   傅正科发布日期:2015-12-01

「吴飞 傅正科:大数据与“被遗忘权”」正文

【内容提要】 对个人信息自主性的保障已经成为当今社会的主流思想,因为如此方能真正保障个人的正常生活。隐私权正是在这样的理念下逐渐发展并受到社会广泛认同的。个人不受他人的干扰,可以决定谁拥有权利获知自己的某些私人信息,这是每个人自主权得到尊重的基本理念。但数字化记忆的可访问性、持久性、全面性以及由此所带来的“凝视”给人类带来了严重挑战,人类日常生活面临数字化时间与空间双重维度的介入,这种介入导致了隐私不保时代的真正来临。“被遗忘权”的提出虽然在一定程度上为化解这样的数字异化提供了一种解决之道,但仍然存在较大的漏洞。

【关 键 词】大数据/圆形监狱/时间凝视/被遗忘权/隐私权/个人信息自主权

如今,媒体上越来越多地充斥着各种闲谈与丑闻,偷窥、暗访已经成为媒体最习以为常的吸引眼球的手段。不少人认为这类信息具有冒犯性,应该被禁止。法学家塞缪尔•D.沃伦和路易斯•D.布兰代斯在1890年建议制定相关方面的法律,保护个人隐私权。如今隐私权的保护已经深入人心,许多人认为,过分刺探公众人物的生活和其他人的生活并非善举,何况许多信息与公共利益和公众兴趣无关。

新媒体的迅速发展一方面解放了普通大众的传播权利,另一方面又带来了许多新的问题,个人隐私权的保护就面临严重的挑战。如《体育画报》泳装模特耶西卡(Yesica Toscanini)醉酒后与朋友拍了一张衣着不得体的照片,后来,这张照片被上传到了网上。她为此起诉了雅虎,要求它删除照片,结果她胜诉了[1]。

一、大数据时代的挑战

2014年7月21日,CNNIC发布的第34次《中国互联网络发展状况统计报告》显示,截至2014年6月,中国网民规模达6.32亿,其中,手机网民规模5.27亿,互联网普及率达到46.9%。新华社发布消息称,从对中国最有影响的10家网站统计看,网民每天发表的论坛帖文和新闻评论达300多万条,微博每天发布和转发的信息超过2亿条①。有统计表明,Facebook每天更新的照片量超过1000万张,每天人们在网站上点击“喜欢”(Like)按钮或者写评论大约有30亿次。YouTube每月接待多达8亿的访客,平均每一秒钟就会有一段长度在一小时以上的视频上传。Twitter上的信息量几乎每年翻一番,每天都会发布超过4亿条微博。其实,有关我们生活的点点滴滴都正逐渐变成数据,存贮云端,大数据时代②就这样来临了。合理利用和分析大数据对人类掌握城市、交通、医疗、民生等方面的情况会更精确,甚至可能通过数据分析而洞察未来的变化,这无疑会极大地造福人类。

数字技术的发展与“云”的出现为人类生活打开了一扇方便快捷之门,甚至更为开放的社会也由此拉开了序幕。不过,所有的技术变革都是双刃剑,我们既要看到其革命性的积极效果,也要看到由此引发的危机,无所不在的数字摄取工具、精准的地理定位系统、云存贮和云计算又将人们推进一个透明的时空之中。数字技术存在异化的可能,人也许会被自己创造的技术奴役。

当我们使用数字设备的时候,行为信息被转化为数字碎片,经由算法,这些碎片将还原出与现实相对应的数据化个体,由此每个人都在数字空间中被“凝视”着。美国著名计算机专家迪博德(John Diebold)曾分析说,当你在银行存钱、提款的时候,你留下的信息绝不仅仅是一笔银行交易,其实你还告诉了银行某一时刻你所处的地理位置。这些信息很可能会成为你其他行为的解释,从而透露你的隐私。例如,如果这个提款记录和你当天的通讯、消费、旅行等其他数据记录整合起来,你当天的行踪和行为就不会有太多的秘密可言。迪博德进一步总结说,在信息时代,计算机内的每一个数据或字节都是构成一个人隐私的血肉。信息加总和数据整合对隐私的穿透力不仅仅是“1+1=2”的,很多时候是大于2的③。

圆形监狱以数据库为其囚禁数据化个体的空间,而算法则是对其中的个体进行凝视的目光,数据空间中的每个个体都无法逃离其凝视。就大数据的算法,face.stat.com创立者基于自己数据挖掘的过程进行了分析。该网站的主要特色是用户可以上传自己的照片,并且浏览和评判他人的照片。创立者在照片下设置了系列问题,诸如:你觉得我有多大?如果你是保安,你会检查我吗?你觉得我聪明吗?你觉得我是否能打得过一只中等大小的狗?你觉得我整过容吗?你觉得我是否值得信任?你觉得我是否聪明?你觉得我是否有才华?你觉得我是否年轻?你觉得我是否富有?等等。创始人使用Pearson关联算法,从大量的数据中找到了一些有趣的关联信息,例如:女人比男人看起来更聪明;女人更有可能打得过一条狗;女人更有可能被雇佣为保安等。人们常用的评论词频通过counts与sort两个命令即可完成检索。研究者指出,当FaceStat的用户描述标签时,可以看出人们对特定类型群体的情感与反应[2]265。美国外交关系委员会兼职高级研究员理查德•福肯瑞斯曾指出,Gmail具备联络跟踪功能,这个功能已与谷歌管理数字照片的免费产品Picasa整合。Picasa具备标签功能,可以告诉谷歌照片在哪里及何时拍摄,此外还具备一个先进的面部识别功能,谷歌可以通过认出一张照片中的某个人,识别用户数字照片库中这个人的所有照片。仅仅将这 三种服务与谷歌的核心搜索功能整合,就能让谷歌在互联网上的几乎任何一张数字照片中找到此人,从而获知用户出现在哪里、什么时候、和谁在一起以及做什么。如果把YouTube加入进来,或者安卓手机,或者谷歌开发或收购的其他任何数据库,其结果会让人大吃一惊[3]。《基督科学箴言报》曾报道了卡内基梅隆大学数据隐私专家的观点:“即使没有姓名、没有社会安全号,只要通过性别、生日和邮编这三个数据项,数据挖掘的技术就能够成功识别全美87%的人口。”[4]

数据本身的特性使得数字化的凝视除在空间上囊括所有的个体,同时还带上了时间的维度。维克托提出了“数字化记忆发展四大驱动力”的观点:数字化、廉价的存储器、易于提取、全球性覆盖。其中的易于提取性使得个体在时间向度上留下的数据痕迹都将永久保留。全国人大代表叶青2011年3月12日在做客正义网直播访谈节目时谈到,个人信息一旦发布到网络上,可能其终身所有东西都会永久留在上面,覆水难收。个人信息的外露可能会遭到某一方或者某一人的“攻击”,一方面是无中生有的,另一方面则会对其真实的负面信息进行炒作。互联网不会遗忘从鸡毛蒜皮的小事到所谓的人生大事,通过探索引擎,关于个人的信息在N多年之后仍然很容易被搜索到,其中一些可能会让当事人感到羞愧、尴尬乃至愤怒。叶青举例说:“比如我要升职的时候,大家就把我过去所有的东西都摆出来,一件很小的事情可能就会对我产生很大的影响。那时候登记的那些信息并不是不真实的,也是真实的。但是,人在一生中会发生很多的变化,那些信息可能是我青春时期的,我不希望跟现在关联起来,我的那些信息可不可以被遗忘掉?”

数据在时间与空间两个维度上的凝视使得个体在数字空间这一公共平台上的当下与过往均无法被抹去。你不知道究竟在什么时候那些监视者会对你发出警告,这倒颇有法国大革命时候的意味,大革命关注的核心就是:防止人们干坏事,驱散他们想要干坏事的念头。换言之,让人们处于不能和不愿的状态④。安德鲁•费尔德玛(Andrew Feldmar)生活在温哥华,他是一位六十多岁的心理咨询师。2006年的某一天,一位朋友从西雅图国际机场赶过来,费尔德玛打算穿过美国与加拿大的边境去接他。但是这一次,边境卫兵用互联网的搜索引擎查询了一下费尔德玛。搜索结果显示,费尔德玛在2001年为一本交叉学科杂志所写的一篇文章中提到自己在20世纪60年代曾服用过致幻剂LSD。因此,费尔德玛被扣留了4个小时,期间被采了指纹,之后还签署了一份声明,内容是他在大约40年前曾服用过致幻剂,而且不准再进入美国境内。安德鲁•费尔德玛是一位没有犯罪记录、拥有学识的专业人员,他知道当年服用致幻剂确实违反了法律,但他坚称自1974年以来就一直没再服用,那是他生命中一段早已远去的时光,一个他认为已被社会遗忘了很久、与现在的他完全不相干的过错。但是,数字技术已经让社会丧失了遗忘的能力,取而代之的则是完善的记忆。虽然年近七十的安德鲁•费尔德玛未曾在互联网上主动披露关于自己的信息,但他怎么会想到,自己曾经发表过的一篇文章居然成为限制他行动的证据。对他而言,“成为数字化记忆的受害者完全是一个可怕的突然袭击”[5]序,8-9。

在这样的时代,难免会产生一种恐惧,大数据时代源自空间与时间两个维度的凝视让我们无处可逃。维克托•迈尔―舍恩伯格教授分析说,数字化记忆具有三个特征:可访问性、持久性、全面性。这便意味着在信息权力与时间的交会处,永久的记忆创造了空间和时间圆形监狱的“幽灵”。完整的数字化记忆摧毁了历史,损害了我们判断和及时行动的能力,让我们无助地徘徊在两个同样让人不安的选择之间:是选择永久的过去,还是被忽视的现在[5]117。数字空间既是实在的,也是虚拟的。说其实在,是因为我们每一个人的言论、行为甚至心理活动都是真实的存在;说是虚拟的,是因为这些数据会存在于云端,它们呈碎片化、无组织的形态,连我们自己都不知道它们在何处。但通过特定的算法,各种机构却有可能完整地获得这些数据。对这些机构而言,我们的数据是完全敞开的,它们可以监视我们的一举一动、一思一感。我们所寄希望获得保护的个人隐私就这样毫无保留地呈现于权力机构之眼中。怎么办?

二、“删帖运动”与“被遗忘权”的提出

2013年4月,英国《卫报》发表了关于“我能删帖吗”的争论文章[6],文章描述了欧洲围绕“被遗忘权”掀起的网络数据保护运动。文章称,有越来越多的网络用户要求博客服务商和网站删除内容,比如有损害或过时的个人信息,还有让人难堪的照片。《卫报》的文章介绍说,隐私权游说团体Big Brother Watch在2013年2月发布的一项调查称,68%的英国民众对自己在网络上的隐私感到担忧,其中22%的调查者表示“非常担忧”。《卫报》的读者调查表明,个人数据和隐私信息在互联网上可能由于多种原因被泄露:一是难以注销社交媒体网站账户,难以确保网站上的所有数据被删除;二是使用Google搜索自己的个人信息时,一些过时的、有失偏颇的或者不正确的搜索结果排在靠前位置;三是缺乏控制其他用户发布含有自己信息图片的方法;四是网络跟踪软件会监控用户网络的使用情况,并得到个人网络活动习惯的全貌。删帖运动可被看作个体为确保自主性,对数字空间中权力的凝视进行抵抗的表征。

2012年1月25日,欧洲议会和理事会公布了《关于涉及个人数据处理的个人保护以及此类数据自由流动的第2012/72、73号草案》(以下简称《2012年欧盟草案》),对1995年出台的《关于涉及个人数据处理的个人保护以及此类数据自由流动的第95/46/EC号指令》进行修订。《2012年欧盟草案》中最具争议性的议案是提出数据主体应享有“被遗忘的权利”(right to be forgotten)。欧盟将“被遗忘权”定义为:“数据主体有权要求数据控制者永久删除有关数据主体的个人数据,有权被互联网所遗忘,除非数据的保留有合法的理由。”[7]有学者将“被遗忘权”定义为:“如果一个人不再想让他的个人信息被信息控制者加工或者存储,并且如果没有保持这些信息的合法基础,这些数据应该从他们的系统中删除。”[8]因此,“被遗忘权”也被称为“删除的权利”(the right to erasure),这一权利对于那些网络用户控制谁能获取他们的个人信息至关重要。

上一篇 」 ← 「 返回列表 」 → 「 下一篇