《大数据时代》读书心得体会.docx
- 文档编号:26381535
- 上传时间:2023-06-18
- 格式:DOCX
- 页数:8
- 大小:21.53KB
《大数据时代》读书心得体会.docx
《《大数据时代》读书心得体会.docx》由会员分享,可在线阅读,更多相关《《大数据时代》读书心得体会.docx(8页珍藏版)》请在冰豆网上搜索。
《大数据时代》读书心得体会
《大数据时代》读书心得体会
读《大数据时代》心得体会
(一)读了《大数据时代》后,感觉到一个大变革的时代将要来临。
虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作者想要终结或颠覆一些传统上作为我们思维和生存基本理论方法和方式。
在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。
在小数据时代,我们会假象世界是怎样运作的,然后通过收集和分析数据来验证这种假想。
随着由假想时代到数据时代的过渡,我们也很可能认为我们不在需要理论了。
书中几乎肯定要颠覆统计学的理论和方法,也试图通过引用《连线》杂志主编安德森的话量子物理学的理论已经脱离实际来终结量子力学。
对此我很高兴,因为统计学和量子力学都是我在大学学习时学到抽筋都不能及格的课目。
但这两个理论实在太大,太权威,太基本了,我想我不可能靠一本书就能摆脱这两个让我头疼一辈子的东西。
作者其实也不敢旗帜鲜明地提出要颠覆它们的论点,毕竟还是在前面加上了很可能认为这样的保护伞。
近几十年,我们总是在遇到各种各样的新思维。
在新思维面前我们首先应该做到的就是要破和立,要改变自己的传统,跟上时代的脚步。
即使脑子还跟不上,嘴巴上也必须跟上,否则可能会被扣上思想僵化甚至阻碍世界发展的大帽子。
既然大数据是通往未来的必然改变,那我就必须不受限于传统的思维模式和特定领域里隐含的固有偏见,跟作者一起先把统计学和量子力学否定掉再说。
反正我也不喜欢也学不会它们。
当我们人类的数据收集和处理能力达到拍字节甚至更大之后,我们可以把样本变成全部,再加上有能力正视混杂性而忽视精确性后,似乎真的可以抛弃以抽样调查为基础的统计学了。
但是由统计学和量子力学以及其他很多我们也很可能认为我们不再需要的理论上溯,它们几乎都基于一个共同的基础——逻辑。
要是不小心把逻辑或者逻辑思维或者逻辑推理一起给不再需要的话,就让我很担心了!
《大数据时代》第页大数据的核心就是预测。
逻辑是——描述时空信息类与类之间长时间有效不变的先后变化关系规则。
两者似乎是做同一件事。
可大数据要的不是因果关系,而是相关关系,知道是什么就够了,没必要知道为什么,而逻辑学四大基本定律(同一律矛盾律排中律和充足理由律)中的充足理由律又明确规定任何事物都有其存在的充足理由。
且逻辑推理三部分——归纳逻辑溯因逻辑和演绎逻辑都是基于因果关系。
两者好像又是对立的。
在同一件事上两种方法对立,应该只有一个结果,就是要否定掉其中之一。
这就是让我很担心的原因。
可我却不能拭目以待,像旁观者一样等着哪一个脱颖而出,因为我身处其中。
问题不解决,我就没法思考和工作,自然就没法活了!
更何况还有两个更可怕的事情。
其一:
量子力学搞了一百多年,为了处理好混杂性问题,把质量和速度结合到能量上去了,为了调和量子力学与相对论的矛盾,又搞出一个量子场论,再七搞八搞又有了虫洞和罗森桥,最后把四维的时空弯曲成允许时间旅行的样子,恨不得马上造成那可怕的时间旅行机器。
唯一阻止那些爱因斯坦们瞎胡闹的就是因果关系,因为爸爸就是爸爸,儿子就是儿子。
那么大数据会不会通过正视混杂性,放弃因果关系最后反而搞出时间机器,让爸爸不再是爸爸,儿子不再是儿子了呢?
其二:
人和机器的根本区别在于人有逻辑思维而机器没有。
《大数据时代》也担心最后做出决策的将是机器而不是人。
如果真的那一天因为放弃逻辑思维而出现科幻电影上描述的机器主宰世界消灭人类的结果,那我还不如现在就趁早跳楼。
还好我知道自己对什么统计学量子力学逻辑学和大数据来说都是门外汉,也许上面一大篇都是在胡说八道,所谓的担心根本不存在。
但问题出现了,还是解决的好,不然没法睡着觉。
自己解决不了就只能依靠专家来指点迷津。
所以想向《大数据时代》的作者提一个合理化建议:
把这本书继续写下去,至少加一个第四部分——大数据时代的逻辑思维。
读《大数据时代》心得体会
(二)信息时代的到来,我们感受到的是技术变化日新月异,随之而来的是生活方式的转变„„我们这样评论着的信息时代已经变为曾经。
如今,大数据时代成为炙手可热的话题。
笔者在这说明信息和数据,只是试图首先说明信息数据的关系和不同,也试图说明,为什么信息时代转变为了大数据时代?
大数据时代带给了我们什么?
信息和数据的定义。
维基百科解释:
信息,又称资讯,是一个高度概括抽象概念,是一个发展中的动态范畴,是进行互相交换的内容和名称,信息的界定没有统一的定义,但是信息具备客观动态传递共享经济等特性却是大家的共识。
数据:
或称资料,指描述事物的符号记录,是可定义为意义的实体,它涉及到事物的存在形式。
它是关于事件之一组离散且客观的事实描述,是构成信息和知识的原始材料。
数据可分为模拟数据和数字数据两大类。
数据指计算机加工的原料,如图形声音文字数字符和符号等。
从定义看来,数据是原始的处女地,需要耕耘。
信息则是已经处理过的可以传播的资讯。
信息时代依赖于数据的爆发,只是当数据爆发到无法驾驭的状态,大数据时代应运而生。
这是否是《大数据时代》一书所未曾阐述的背景材料?
在《大数据时代》一书中,大数据时代与小数据时代的区别:
思维惯例。
大数据时代区别与转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。
也就是说只要知道是什么,而不需要知道为什么。
作者语言绝对,却反思其本质区别。
数据的更多更杂,导致应用主意只能尽量观察,而不是倾其所有进行推理?
这也是明智之举使用用途。
小数据停留在说明过去,大数据用驱动过去来预测未来。
笔者认为数据的用途意在何为,与数据本身无关,而与数据的解读者有关,而相关关系更有利于预测未来。
结构。
大数据更多的体现在海量非结构化数据本身与处理方法的整合。
大数据更像是理论与现实齐头并进,理论来创立处理非结构化数据的方法,处理结果与未来进行验证。
分析基础。
大数据是在互联网背景下数据从量变到质变的过程。
笔者认为,小数据时代也即是信息时代,是大数据时代的前提,大数据时代是升华和进化,本质是相辅相成,而并非相离互斥。
数据未来的故事。
数据的发展,给我们带来什么预期和启示?
银行业天然有大数据的潜质。
客户数据交易数据管理数据等海量数据不断增长,海量机遇和挑战也随之而来,适应变革,适者生存。
我们可以有更广阔的业务发展空间可以有更精准的决策判断能力可以有更优秀的经营管理能力„„可以这些都基于数据的收集整理驾驭分析能力,基于脱颖而出的创新思维和执行。
因此,建设数据仓库,培养数据思维,养成数据治理,创造数据融合,实现数据应用才能拥抱大数据时代,从数据中攫取价值,笑看风云变换,稳健赢取未来。
读《大数据时代》心得体会(三)这本书里主要介绍的是大数据在现代商业运作上的应用,以及它对现代商业运作的影响。
《大数据时代》这本书的结构框架遵从了学术性书籍的普遍方式。
也既,从现象入手,继而通过对现象的解剖提出对这一现象的解释。
然后在通过解释在对未来进行预测,并对未来可能出现的问题提出自己看法与对策。
下面来重点介绍《大数据时代》这本书的主要内容。
《大数据时代》开篇就讲了通过人们在搜索引擎上搜索关键字留下的数据提前成功的预测了年美国的的爆发地与传播方向以及可能的潜在患者的事情。
的预测比政府提前将近一个月,相比之下政府只能够在流感爆发一两个周之后才可以弄到相关的数据。
同时的预测与政府数据的相关性高达%,这也就意味着预测数据的置信区间为%,这个数字远远小于传统统计学上的常规置信区间%!
而这个数字就是大数据时代预测结果的相对准确性与事件的可预测性的最好证明!
通过这一事以及其他的案例,维克托提出了在大数据时代样本=总体的思想。
我们都知道当样本无限趋近于总体的时候,通过计算得到的描述性数据将无限的趋近于事件本身的性质。
而之前采取的样本 而互联网终端与计算机的出现使数据的获取存储与处理难度大大降低,因而相对准确性更高的样本=总体的测算方式将成为大数据时代的主流,同时大数据时代本身也是建立在大批量数据的存储与处理的基础之上的。
接下来,维克多又通过了追求高精确性的电脑翻译计划的失败与只是将所有出现过的相应的文字语句扫描并储存在词库中,所以无论需要翻译什么,只要有联系词库就会出现翻译,虽然有的时候的翻译很无厘头,但是大多数时候还是正确的,所以的电脑翻译的计划的成功,表明大数据时代对准确性的追求并不是特别明显,但是相反大数据时代是建立在大数据的基础住上的,所以大数据时代追求的是全方位覆盖的数字测度而不管其准确性到底有多高,因为大量的数据会湮埋少数有问题的数据所带来的影响。
同时大量的数据也会无限的逼近事物的原貌。
之后,维克托又预测了一个在大数据时代催生的重要职业——数据科学家,这是一群数学家统计学与编程家的综合体,这一群人将能够从获取的数据中得到任何他们想要的结果。
换言之,只要数据充足我们的一切外在的与内在的我们不想让他人知道的东西都见会在这一群家伙的面前展现得淋漓尽致。
所以为了避免个人隐私在大数据时代被这一群人利用,维克托建议将这一群人分为两部分,一部分使用数据为商业部门服务,而另一群人则负责审查这一些人是否合法的获得与应用数据,是否侵犯了个人隐私。
无论如何,大数据时代将会到来,不管我们接受还是不接受!
我觉得《大数据时代》这本书写的很好,很值得一读。
因为会给我们很多启发,比如你在相关的社交网站发表的言论或者照片都很有可能被数据科学家们利用,从而再将相关数据卖给各大网店。
不过,事实就是我们将会成为被预测被引诱的对象。
所以说,小心你在网上留下的痕迹。
我喜欢这本书是因为它给我展现了一个新的世界。
读《大数据时代》心得体会(四)利用周末,一口气读完了涂子沛的大作《大数据》。
这本书很好看,行文如流水,引人入胜。
书中,你读到的不是大数据技术,更多是与大数据相关的美国政治经济社会和文化的演进。
作为一名信息化从业者,读完全书,我深刻感受到了在信息化方面中国与美国的各自特色,也看到了我们与美国的差距。
有几个方面的体会,但窥一斑基本能见全貌。
一是政府业务数据库公开的广度和深度。
近年来,随着我国信息公开工作的推进,各级政府都在通过政府门户网站建设积极推进网上政务信息公开,但我们的信息公开,现阶段还主要是政府的政策法律法规标准公文通告工作职责办事指南工作动态人事任免等行政事务性信息的公开。
当然,实时的政府业务数据库公开也已经取得很大进步。
在中国政府门户网,可以查询一些公益数据库,如国家统计局的经济统计数据环保部数据中心提供的全国空气水文等数据,气象总局提供的全国气象数据,民航总局提供的全国航班信息等;访问各个部委的网站,也能查到很多业务数据,如发改委的项目立项库工商局的企业信用库国土资源部的土地证库国家安监总局的煤矿安全预警信息库各类工程招标信息库等等。
这是一个非常大的进步,也是这么多年电子政务建设所取得的成效和价值!
但是,政务业务数据库中的很多数据目前还没有实现公开,很多数据因为部门利益和保密等因素,还仅限于部门内部人员使用,没有公开给公众;已经公开的数据也仅限于一部分基本信息和统计信息,更多数据还没有被公开。
从《大数据》一书中记录的美国数据公开的实践来看,美国在数据公开的广度和深度都比较大。
美国人认为用纳税人的钱收集的数据应该免费提供给纳税人使用,尽管美国政府事实上对数据的公开也有抵触,但民愿不可违,美国政府的业务数据越来越公开,尤其是在奥巴马政府签署《透明和开放的政府》文件后,开放力度更加大。
是美国联盟政府新建设的统一的数据开放门户网站,网站按照原始数据地理数据和数据应用工具来组织开放的各类数据,累积开放个原始和地理数据集。
在中国尚没有这样的数据开放的网站。
另外,由于制度的不同,美国业务信息公开的深度也很大,例如,网上公布的美国总统白宫访客记录公布的甚至是造访白宫的各类人员的相关信息;美国的网站,能够逐条跟踪记录分析联邦政府每一笔财政支出。
这在中国,目前应该还没有实现。
二是对政府对业务数据的分析。
目前,中国各级政府网站所提供的业务数据基本上还是数据表,部分网站能提供一些统计图,但很少能实现数据的跨部门联机分析数据关联分析。
这主要是由于以往中国政务信息化的建设还处于部门建设阶段。
美国在这方面的步伐要快一些,美国的网站,不仅提供原始数据和地理数据,还提供很多数据工具,这些工具很多都是公众公益组织和一些商业机构提供的,这些应用为数据处理联机分析基于社交网络的关联分析等方面提供手段。
如上提供的白宫访客搜索工具,可以搜寻到访客信息,并将白宫访客与其他微博社交网站等进行关联,提高访客的透明度。
三是关于个人数据的隐私。
在美国,公民的隐私和自有不可侵犯,美国没有个人身份证,也不能建立基于个人身份证号码的个人信息的关联,建立中央数据银行的提案也一再被否决。
这一点,在中国不是问题,每个公民有唯一的身份信息,通过身份证信息,可以获取公民的基本信息。
今后,随着国家人口基础数据库等基础资源库的建设,公民的社保医疗等其他相关信息也能方便获取,当然信息还是限于政府部门使用,但很难完全保证整合起来的这些个人信息不被泄露或者利用。
数据是信息化建设的基础,两个大国在大数据领域的互相学习和借鉴,取长补短,将推进世界进入信息时代。
我欣喜地看到,美国政府年启动了大数据研发计划,投资亿美元,推动大数据提取存储分析共享可视化等领域的研究,并将其与超级计算和互联网投资相提并论。
同年,中国政府年也批复了十二五国家政务信息化建设工程规划,总投资额估计在几百亿,专门有人口法人空间宏观经济和文化等五大资源库的五大建设工程。
开放共享和智能的大数据的时代已经来临!
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据时代 数据 时代 读书 心得体会