删除大数据取舍之道22.docx
- 文档编号:1497314
- 上传时间:2022-10-22
- 格式:DOCX
- 页数:18
- 大小:41.92KB
删除大数据取舍之道22.docx
《删除大数据取舍之道22.docx》由会员分享,可在线阅读,更多相关《删除大数据取舍之道22.docx(18页珍藏版)》请在冰豆网上搜索。
删除大数据取舍之道22
删除:
大数据取舍之道
《删除:
大数据取舍之道》喝醉的海盗
对于人类而言,遗忘一直是常态,而记忆才是例外。
然而,由于数字技术与全球网络的发展,这种平衡已经被打破了。
如今,往事正像刺青一样刻在我们的数字皮肤上,遗忘已经变成了例外,而记忆却成了常态……
在这个记忆已经成为常态的时代,难道每个公开自己信息的人只能永远对信息束手无策吗?
我们真的想要一个由于无法遗忘,而永远不懂得宽恕的未来吗?
未来可能遭遇到的悲剧,会对我们现在的行为产生寒蝉效应。
借助数字化记忆,圆形监狱能够随时随地监视我们。
事实上,并不是技术迫使我们去记忆。
技术只是促进了遗忘的终止——而只有当我们迫切想要记住的时候,遗忘才会被终止。
喝醉的海盗
史黛西·施奈德(StacySnyder)最大的梦想就是成为一名教师。
在2006年春天,这位25岁的单身母亲已经完成了她的学业,并且对她未来的事业充满了期待。
但是她的梦想破碎了。
她心仪的学校明确地告诉她,她不能成为一名教师,虽然她已经修满了所有的学分,通过了所有的考试,完成了所有的实习训练——而且在许多方面成绩优异。
然而,她被取消了当教师的资格,理由是,她的行为与一名教师不相称。
她的行为?
校方指的是一X网上的照片,照片里的她头戴一顶海盗帽子,举着塑料杯轻轻啜饮着。
史黛西·施奈德曾将这X照片放在MySpace她的个人网页上,并且取名为“喝醉的海盗”。
这X照片她是给朋友看的,也许只是为了搞怪而已。
然而,在史黛西实习的那所大学里,一位过度热心的教师发现了这X照片,并上报给校方,校方认为网上的这X照片是不符合教师这个职业的,因为学生可能会因看到教师喝酒的照片而受到不良影响。
于是,史黛西打算将这X照片从她的个人网页上删除。
但是危害已经发生了:
她的个人网页已经被搜索引擎编录了,而且,她的照片已经被网络爬虫(webcrawler)程序存档了。
互联网记住了史黛西想要忘记的东西。
后来,史黛西控告了这所大学,但也没能最终胜诉。
她认为,将那X照片放在网上并不能说明一名未来教师的不称职和不专业。
毕竟,在那X照片中并没有显示塑料杯里装的究竟是什么东西。
即便显示了,史黛西,这位拥有两个孩子的单身母亲也早已达到了在私人聚会上喝酒的年龄。
然而,这个案例与大学是否应该给史黛西教师资格的正确性或愚蠢程度无关,而是与某种更为重要的东西有关,那就是遗忘的重要性。
《删除:
大数据取舍之道》一个没有遗忘的时代
有史以来,对于我们人类而言,遗忘一直是常态,而记忆才是例外。
然而,由于数字技术与全球网络的发展,这种平衡已经被改变了。
今天,在广泛流行的技术的帮助下,遗忘已经变成了例外,而记忆却成了常态。
这种局面是如何发生的,为什么会发生,对于我们个人和我们的社会而言这一局面的潜在后果是什么,以及针对这一局面,如果可能的话,我们能够做些什么,这些都是本书关注的问题。
对于某些人而言,史黛西·施奈德的遭遇可能听起来只是个例外,但其实不然。
自此之后发生了许多起非常窘迫的案例,甚至是法律诉讼——从无法让互联网忘记十多年前细微证据的知名大律师,到由于在facebook上抱怨工作无聊而因此失业的英国小姑娘。
截至2008年,在MySpace上拥有个人网页的人数超过1.1亿,他们都和史黛西·施奈德一样。
而且MySpace并不是网民唯一青睐的社交。
MySpace的直接竞争者facebook,截至2009年年初,已经有1.75亿个个人用户创建的在线网页。
尽管facebook与MySpace都主要锁定美国市场(虽然这种局面正在改变),但是这种现象并非仅仅发生在美国。
Google公司旗下的社交Orkut,已经拥有1亿多名用户,而且大部分用户在巴西与印度。
世界各地的其他多个还拥有至少2亿名用户。
这些数字反映了一个更为普遍的趋势。
互联网浪潮的第一个阶段早已随网络泡沫及其破灭而告终,在这个阶段中,互联网的发展与访问信息以及通过全球网络与他人互动息息相关(你可以称其为Web1.0时代)。
而到2001年,用户开始意识到互联网并不仅仅只是一个接收信息的网络,而且还是你可以生成信息并与你的同龄人共享信息的网络(通常被称为Web2.0时代)。
年轻人尤其喜欢Web2.0的这些性能。
到2007年年底之前,美国的一家趋势调查机构皮尤研究中心(PewResearch)发现,三分之二的青少年“参与了互联网上一个或者多个X围广泛的内容创建活动”,而且在创建和共享内容上,女孩要多于男孩。
每天,facebook平均每秒钟都会收到来自世界各地用户的1000万个网络应用请求。
约翰·帕尔弗雷(JohnPalfry)与乌斯·加瑟教授(UrsGasser)曾充分论述,公开个人的信息都已经深深地嵌入了全球的青年文化中——无论是登入facebook的次数、个人日志与评论、照片、好友状态,还是情侣关系(“恋爱中”或者“只是朋友”)、内容偏好与认同(在线照片或者“标签”)、个人的地理位置(通过“地理标签”或者类似Dopplr的可获知),或者仅仅只是微博更新(比如twitter)。
随着这些年轻人逐渐长大,以及越来越多的成年人拥有类似地特征,史黛西·施奈德的遭遇将会不断被重演,而且不仅对于整整一代人是如此,对于我们整个社会也将如此。
《删除:
大数据取舍之道》抹不掉的致幻剂阴影
虽然Web2.0刺激了这一局面的发展,但是传统出版业在互联网力量的推动下也导致了惊人相似的结果。
让我们来看看安德鲁·费尔德玛(AndrewFeldmar)的遭遇。
这位六十多岁的加拿大心理咨询师生活在温哥华。
2006年的某一天,一位朋友从西雅图国际机场赶过来,费尔德玛打算穿过美国与加拿大的边境去接他,就像曾经上百次做过的那样。
但是这一次,边境卫兵用互联网搜索引擎查询了一下费尔德玛。
搜索结果中显示出了一篇费尔德玛在2001年为一本交叉学科杂志所写的文章,在文中他提到自己在20世纪60年代曾服用过致幻剂LSD。
因此,费尔德玛被扣留了4个小时,其间被采了指纹,之后还签署了一份声明,内容是他在大约40年前曾服用过致幻剂,而且不准再进入美国境内。
安德鲁·费尔德玛是一位没有犯罪记录、拥有学识的专业人员,他知道当年服用致幻剂确实违反了法律,但是他坚称自1974年以来就一直没再服用过。
当边境卫兵拦下他时,这件事已经过去快40年了。
对于费尔德玛而言,那是他生命中一段早已远去的时光,一个他认为已被社会遗忘了许久、与现在的他完全不相干的过错。
但是,数字技术已经让社会丧失了遗忘的能力,取而代之的则是完善的记忆。
有人会说,史黛西·施奈德的痛苦主要是由她自己造成的。
她将她的照片放在自己的网页上,并且加了一个引发歧义的标题。
或许,她并没有意识到全世界都能找到她的网页,而且竟然在她删除照片很久之后,仍有可能通过互联网档案访问她的照片。
作为互联网时代的一员,她也许应该更谨慎地考虑一下,哪些内容可以在互联网上公开。
不过,安德鲁·费尔德玛的遭遇却与她不同。
年近七十的他可不是十几岁的互联网发烧友,而且可能从来没预料到,他在那样一本晦涩杂志上发表的文章,居然能在全球化的网络上如此容易地被找到。
对他而言,成为数字化记忆的受害者完全是一个可怕的突然袭击。
但是,即便史黛西与安德鲁能预见这个结果,难道这就意味着每个公开自己信息的人只能永远对信息束手无策吗?
关于互联网是否会遗忘以及何时遗忘,难道我们没有一点发言权吗?
我们真的想要一个由于无法遗忘,而永远不懂得宽恕的未来吗?
“现在,青春期时一个愚蠢的错误会造成严重的后果,而且这个不良记录的阴影会一直笼罩着他们的余生。
”家庭教师协会(PTA)的联合主席凯瑟琳·戴维斯(CatherineDavis)评论说。
如果我们不得不担心,关于我们的所有信息,将会被保留得比我们的寿命更长,我们还会对琐碎的流言蜚语发表我们的观点吗?
我们还会轻松地分享个人的经历吗?
我们还敢做出各种政治评论吗?
我们还会进行自我审查吗?
完善记忆的寒蝉效应①会改变我们的行为。
史黛西与费尔德玛表示,今后将会以完全不同的方式谨慎行事。
“当心你发布在网上的信息。
”史黛西说。
而费尔德玛则更富见地地感叹,“我要警告所有人,你留在网络上的电子足迹将在某一天对你造成伤害。
那是无法被擦除的。
”
取舍之道
不再遗忘的后果,比人们建立并维护多年的声誉遭受一次正面攻击的后果要深远得多,也更让人苦恼。
如果我们过去所有的行为,无论是否XX,都一直存在,那么当我们进行思考与决策时,怎样才能从自己的过去中解脱出来呢?
完善的记忆会使我们对待他人像对待自己那样不宽恕吗?
尽管如此,史黛西与费尔德玛仍然自愿地公开关于他们遭遇的信息。
从严格意义上来讲,他们也需要为这种公开的后果承担责任。
然而,我们往往在公开自己的信息时,并没有真正意识到我们正在“公开”自己的信息。
《删除:
大数据取舍之道》Google记得你的一切
在德国城市爱森纳赫(Eisenach)城外坐落着一家名叫MAD的巨型迪斯科舞厅,它能容纳4000名顾客。
当顾客进入这家舞厅时,他们必须出示他们的护照或者由政府发布的XX;这些顾客的详细资料都被输入到一个数据库中,连同一起被存入的还包括他们的数字脸部照片。
每名顾客都会有一X专用的支付卡,他们只能用这X卡支付在MAD餐厅及多个酒吧中消费酒水与食品的账单。
每次交易都会被添加到顾客的永久数字记录中。
据一次电视报导,2007年年底之前,MAD数据库存储的信息包括一万三千多名顾客与几百万次交易。
60台数字摄像机持续地拍摄迪斯科舞厅及周围的每个角落;记录与存储的录像所占的硬盘空间超过8000G。
顾客的实时信息、他们的交易行为,以及他们的消费偏好都被显示在一个专用控制室里的大屏幕上,这个控制室中的情景仿佛出自007电影一样。
管理人员很自豪地说,每周7天每天24个小时,当地的警察都能通过互联网在线访问MAD舞厅硬盘里存储的信息。
即便有,也只是少数顾客才能意识到他们的一举一动都被记录了,并且会被保存多年,同时第三方机构还可以访问这些信息——这给成千上万名不知情的顾客造成了一种深远的信息阴影。
再举一个更为普遍的例子,互联网搜索引擎。
Google、!
、微软搜索、Ask.以及对万维网(WorldWideWeb)进行编录的其他许多搜索引擎,通过对网页的逐个搜索,使得所有人仅在搜索框中键入一两个关键词就能访问这些网页。
我们知道,同时假设搜索引擎也知道大量的信息,而且这些信息可以通过全球互联网上的网页进行获取。
多年来,这种易于使用且功能强大的搜索引擎,成功地将世界各地的信息资源展现在几十亿用户面前。
然而,搜索引擎所记住的,要比网页上所发布的信息多得多。
2007年春天,Google承认,直到那天他们一直在存储每位用户曾经键入的每次搜索请求,同样被存储的还有每位用户随后点击访问的每一条搜索结果。
通过保存大量被整齐排列的搜索关键词(Google每月收到的搜索请求大概有300亿次),Google能够将这些数据与人口统计资料联系起来。
比如,Google能够显示出搜索请求的趋势,甚至是几年以后的趋势。
Google能告诉我们,2006年秋天在美国印第安纳州首府印第安纳波利斯人们多久会搜索一次“伊拉克”,或者2007年圣诞季在亚特兰大的中产阶级中搜索最多的关键词是什么。
不过,更为重要的是,通过智能地整合登录数据、cookies数据与IP地址,Google能够以极高的准确率将时间跨度很远的多次搜索请求与某个人关联起来。
结果非常惊人。
Google能够识别出我们每个人在搜索什么,什么时候搜索的,以及我们可能觉得足够准确并点击进去的搜索结果是什么。
Google知道我们生活中的任何重大改变——在2000年你婚礼之后买了一套房子,在2003年有一次可怕的非典恐慌,在那一年年底你有了一个新出生的宝宝。
但是,Google也知道关于我们的详细细节,哪怕是我们已经忘记了很久的细节,被我们大脑当作不相干的东西而丢弃掉的细节。
但是,这些被遗忘的细节
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 删除 数据 取舍 22