数学之美读后感文档格式.docx
- 文档编号:17491852
- 上传时间:2022-12-06
- 格式:DOCX
- 页数:9
- 大小:36.86KB
数学之美读后感文档格式.docx
《数学之美读后感文档格式.docx》由会员分享,可在线阅读,更多相关《数学之美读后感文档格式.docx(9页珍藏版)》请在冰豆网上搜索。
在大学里我很荣幸的看完《数学之美》这本书,小学、初中、高中都是一路参加数学竞赛,名次都还不错,自己对数学有很深的感情,大学选了个并不感兴趣的专业。
看这本书的过程中找到了很多高中在看竞赛书的感觉,里面提到的很多概率论(不等式)、图论、数论的知识是高中数学联赛复试的重点,高中的时候已经研究的很深了,不过大学荒废了之后也忘得差不多了,书中提到的很多定。
还很有亲切感 书名叫做《数学之美》,显得有些太大,毕竟更多的是吴军在google做搜索相关工作用到的数学模型的介绍与总结,提到的数学部分大多集中在概率论、图论、数论领域,所以书名太大了。
不得不说吴军是一个大家,文字中能够透露出大家的气势,书中不断的穿插着各种历史上的大科学家以及科技领域的大家的小故事甚至八卦,从文字中非常能够感受到吴军是一个和他们一个层次的人(即使他自己会自谦说是一个二流的工程师之类) 书中具体的模型就不介绍了,说几点我学到的知识(仅仅皮毛),能列出来的都是看完还有点印象的:
1.在互联网的世界中,信息是如何量化的,信息熵是怎么回事?
有啥用?
2.搜索领域中,语言是如何统计的,尤其是如何通过概率模型进行分词 3.搜索引擎是如何工作的—网络爬虫是怎么回事儿 4.PageRank是怎么回事?
为了解决什么问题?
5.密码与解密领域的数学模型,尤其提到的二战时候的各种解密的趣事儿,提到的电视剧《暗算》打算抽空看下 6.拼音输入法的数学模型 7.、文本自动分类的模型 …… 看完之后最大的感受就是:
1.数学模型巨大作用,推动着新技术的发展 2.攻城师是一个伟大的职业,能够运用这些知识转化为生产力,非常牛叉 3.书中提到了很多数学模型都是在不断的进化、改良、升级,也就是说有人不断的在做优化,会有不断更好的模型、更新的技术出现,跟得上技术的发展可能也是比较重要的,否则很多人一直在做某一点上的持续优化就没有意义了。
但同时技术很大的作用是用来解决实际问题的,书中提到的各个数学模型、各种方法都是为了解决人们的需求或者业务的需求,毕竟公司不是科学研究所,所以追求通过技术直接解决用户需求或者做成易用的工具给业务人员、运营人员来间接解决用户需求是挺重要的,可能不是技术人员觉得做到80分就可以了,而是用户、使用工具的人觉得做到80分是一个重要的衡量 提到“工具”,想到赵赵说过的一句话:
“不好用就等于没有”,可能就是这个点,同时运用工具的人必须好好的运用,如果用不好甚至不用就太对不起技术了。
其中在第一章中文字和语言VS数学和信息讲到:
数学.文字和自然语言一样,都是信息的载体,他们之间原本有着天然的联系。
语言和数学的产生都是为了同一个目的的-记录和传播信息。
但是把数学和信息系统自觉的联系在一起是半个世纪前香浓博士发明信息论以后的事了,在此之前,数学的发展更多地和人类对自然的认识以及生产活动联系在一起,包括天文学.几何学和工程学甚至生物学等,而数学和语言几乎是没有交集的。
我们见到很多数学家同时是物理学家或者天文学家,但是过去很少有数学家同时是语言学家。
本书几乎全部的章节讲的都是近半个多世纪的事情,但是在这一章里,我们将先通过时间隧道回到远古回到语言.文字和数学产生的年代。
我们的先人很聪明,在很久以前就开始学会了传播信息语言了,从不会到会,从模糊到清楚,这个过程我没有仔细的了解与研究,因为这个工作量实在是太大太多了,语言和信息的产生将会伴随这数学的产生,所以数学在古代时期就已经有了,虽然古代的数学相对与现在的数学比较简单些,但是它也为了现代数学奠定了基础。
怪叫声听到声音
说话人(信息源)编码信道解码接受者
图1.1原始人类与现代人类的通信模型有什么不同
于我而言,语音视别是一类高科技,作为非专业人土,深觉高奥。
但看完数学之美之后,顿感惊诧,原来如此深奥东西的解决方法自己也学过,并且理工科读过大学的人都学过,那就是统计学中的条件概率p(a/b),即b事件发生条件下a事件发生的概率。
如果s表示一连串特定顺序排列的词w1,w2,…,wn,换句话说,s可以表示某一个由一连串特定顺序排练的词而组成的一个有意义的句子。
现在,机器对语言的识别从某种角度来说,就是想知道s在文本中出现的可能性,也就是数学上所说的s的概率用p(s)来表示。
利用条件概率的公式,s这个序列出现的概率等于每一个词出现的概率相乘,于是p(s)可展开为:
p(s)=p(w1)p(w2|w1)p(w3|w1w2)…p(wn|w1w2…wn-1) 其中p(w1)表示第一个词w1出现的概率;
p(w2|w1)是在已知第一个词的前提下,第二个词出现的概率;
以次类推。
不难看出,到了词wn,它的出现概率取决于它前面所有词。
从计算上来看,各种可能性太多,无法实现。
因此我们假定任意一个词wi的出现概率只同它前面的词wi-1有关(即马尔可夫假设),于是问题就变得很简单了。
现在,s出现的概率就变为:
p(s)=p(w1)p(w2|w1)p(w3|w2)…p(wi|wi-1)… (当然,也可以假设一个词又前面n-1个词决定,模型稍微复杂些。
) 接下来的问题就是如何估计p(wi|wi-1)。
现在有了大量机读文本后,这个问题变得很简单,只要数一数这对词(wi-1,wi)在统计的文本中出现了多少次,以及wi-1本身在同样的文本中前后相邻出现了多少次,然后用两个数一除就可以了,p(wi|wi-1)=p(wi-1,wi)/p(wi-1)。
也许很多人不相信用这么简单的数学模型能解决复杂的语音识别、机器翻译等问题。
其实不光是常人,就连很多语言学家都曾质疑过这种方法的有效性,但事实证明,统计语言模型比任何已知的借助某种规则的解决方法都有效。
比如在google的中英文自动翻译中,用的最重要的就是这个统计语言模型。
去年美国标准局(nist)对所有的机器翻译系统进行了评测,google的系统是不仅是全世界最好的,而且高出所有基于规则的系统很多。
这就是数学的美妙之处了,它把一些复杂的问题变得如此的简单。
看到《数学之美》,在感叹数学的美妙与神奇之处时,自然而然联系到自己专业(信息与计算科学)中的数学模型。
现在找文献,搜索期刊一大堆基于数学的专业文献,灰色数学的、模糊数学的、非线性的、系统的,等等,这么多的数学的使用,促进了一大批的文章,但这些数学方法的应用究竟是发现了哪些问题?
还是解决了实际问题吗?
还是仅发了文章,满足了需求?
现实是文章好发,用着难用,解决问题还得传统的方法,那么是这些数学方法不行,还是用的太肤浅,根本没发挥其威力来?
如果没有发挥出威力来,那怎么用?
怎么发挥?
第8章里的“索引”,作者讲到谷歌面试产品经理的一道题目:
如何向你的奶奶解释搜索引擎。
关于这个问题,好的回答据说是用图书馆的索引卡片做类比。
我奶奶是个文盲,一生为农,日出而作,日落而息。
她很少看电视,更别说图书馆。
所以用图书馆的例子,对我们来说,很生动;
对她来说,很生涩。
我们村的田地是按照地形、土质和流水等来划分的,计有一等地、二等地和三等地。
一般情况下,一等地用来种水稻,二等地用来种菜,三等地用来种水果。
所以当我爸爸想要给我摘桔子的时候,她肯定不会从一等地或者二等地一块地一块地找过来,而是直接跑到三等地(一般就是山上)。
像这样的索引,是基于脑子里的“数据库”,因为田地不会很多,多了也来不及种,所以跟布尔代数没什么关系。
但是这样解释,我奶奶就会大概明白了。
我奶奶生前一次电脑也没用过,跟她解释这些,唯一的意义是,她会觉得我没有敷衍她,这会使她欣慰——如果有机会解释的话。
杨小凯曾经说,如果张五常多加注重使用数学模型,那诺奖也许就拿下了。
张五常对此不以为然,反以为傲,自诩当今世上只有科斯、阿尔钦和他才敢只用文字,不借助数学模型就在经济学界占有一席之地。
当然,张五常也不是彻底否定数学的作用,他认为能够用文字解释的经济学原理,不必使用数学对其复杂化。
数学在信息学和经济学里都有广泛应用,但是在信息科学方面,对数学作用大小的争论就没有经济学那么大了。
我们常说搜索引擎的竞价广告,就可能经历到第三方公司,通常他们宣传自己是谷歌或者别的搜索引擎公司的代理商,然后通过不正当手段为客户提高网页的排名。
谷歌在消除网络作弊方面做了很多努力,通过修改排序算法来为搜索者提供更加准确实效的信息。
“作弊的本质是在网页排名信号中加入噪音,因此反作弊的关键是去噪音。
沿着这个思路可以从根本上提高搜索算法抗作弊的能力。
”我们公司就是吃了这个亏,交了不少钱给第三方公司,结果算法一变,关键词的排名从前三下降到前三页没影。
社交搜索正在雄起,但是如果想要在传统的搜索引擎中占据有利排名,我想,第三方公司的技术水平是很关键的。
大学专业课里,数电总是要比模电简单不少。
自然界里大部分的信号都属于模拟信号。
所谓模拟信号,是指时间和数值上都是连续变化的信号。
在实际电路中,模/数转换是一个很重要的过程,将预处理的模拟信号经过模/数变换为数字信号,然后进行数字信号处理。
而数字化处理有很多优点,比如功能强大、抗干扰能力强、易集成化等。
简而言之,如果没有数学,就没有数字信号处理的概念,也就无法进行信号的传输,而数字信号传输在大规模的集成电路里是必不可少的,这是通信成功的基本要求。
之前看到有人说如果高中看这本书,也许数学就是另一番天地,会有所突破。
我不觉得,如果高中看这种书,我想,大多数人还是会对数学更加望而却步。
本书更适合通信电子这些专业的学生,在学习专业课的时候辅助阅读,对理解通信原理、数电模电等都有更形象生动的想法。
人类历史就是一部工具的进化史。
石器、青铜、铁器、火药、蒸汽机、内燃机、电报、电话、电视、计算机、卫星、互联网,工具的进步引领着文明的进步。
新的工具不断淘汰老的工具,就像互联网视频点播正在淘汰电视、微博正在淘汰报纸、电子书正在淘汰纸质书那样。
但有一些古老的工具,今天仍有人在学习和使用,甚至在上面花费许多时间。
毛笔就是这样一个例子。
今天学习掌握毛笔这种“落后的”工具,还有什么意义?
其实我们在使用一些“落后的”工具时,主要是在学习工具背后的思想。
书法和绘画中蕴含的艺术审美的一般原则,经得起具体工具变迁的考验。
甲骨文、金文、石鼓文所包含的对空间构图的理解,仍然值得现代人学习。
思想工具是比实物工具更强大的工具。
工具组合使用,形成更强大的新工具。
《数学之美》中提到的马尔可夫链虽然是很强大的工具,但我在数学课上没有听老师提到过。
这本书中给我印象最深的例子是余弦定理和新闻分类。
余弦定理是中学数学,再加上一些不算很难的多维向量的知识,竟然解决了计算机新闻分类这样的难题!
每一种工具的背后,是人们对世界的一种理解。
蒸汽机和内燃机背后,是力学的世界。
电报、电话、电视、计算机和互联网背后,是信息的世界。
数学是抽象的工具,是其他工具背后的工具。
每一门学科要成为科学,都少不了数学。
也许有一天人们会习惯,用数学工具来分析艺术。
数学是一种语言,它源于具体的世界,又高于具体的世界。
如果说语言是对世界的认识和描述,如果说数学是一种语言,那么它一定是最接近神的语言。
看似毫不相关,却又能描述万事万物。
学习数学有什么用?
物理学家费曼当年在大一时提出这个问题,他的师兄建议他转到物理系。
今天,这个问题已不成为问题。
具有扎实数学功底的人才正进入各行各业,例如金融业。
我认识一个出版社的老总,他招应届毕业生有一个条件:
数学要好。
工具虽好,关键还要会用。
最终要回到掌握先进工具的人。
软件算法工程师加上计算机集群,这是目前一流企业必需的装备。
正如马克.安德森所说的,各行各业的一流公司,都是软件公司。
优秀的软件算法工程师,是人才争夺的焦点。
这样,我们就容易理解Google招工程师的要求。
对信息加工处理和传递的能力不断增强,是知识经济的特点。
《数学之美》展示了Google如何运用数学和计算机网络,带领我们进入云计算和大数据时代。
知识经济时代的工作,就是在各自的领域中进行科学研究。
科学研究要大胆假设,小心求证。
科学研究要量化。
科学研究要有对比实验。
科学研究要有数学模型。
科学研究要有田野调查。
科学研究要有文献查证。
科学研究要有同行评议。
《数学之美》向我们介绍了自然语言分析领域的科研方法和过程。
任何一个领域,深入进去都有无数的细节。
有兴趣的人不但没被这些细节吓倒,反而会兴致勃勃地研究,从而达到令人仰慕的高度。
吴军先生向我们展示了数学和算法中的这些细节,也展示了他所达到的高度。
值得我学习。
在第二章中自然语言处理——从规则到统计中我们了解到语言出现的目的是为了人类之间的通信。
字母.文字和数学实际上是信息编码的不同单位。
任何一种语言都是一种编码方式,而语言的语法规则是编解码的算法。
我们把一个要表达出来的意思。
通过某种语言的一句话表达出来,就是用这种语言的编码方式对头脑中信息做的一次编码,编码的结果就是产生一连串文字。
而如果对方懂得这门语言,他或者就可以用这门语言的解码方法获得说话人的表达信息。
这就是语言的数学本质。
虽然传递信息是动物也能做到的,但是利用语言来传递信息是人类的特质。
再基于统计的自然语言处理方法,在数学模型上是和通信相通的,甚至就是相同的。
因此,在数学意义上自然语言处理又和语言的初衷——通信联系在一起了。
但是我也知道科学家们认识到这个联系花了好几十年的时间。
、
在数学之美这本书中我最喜欢的一章就是第四章谈谈中文分词,因为毕竟联系到了自己的生活,在生活中所处都看到用到,对于西方的拼音语言来讲,词之间有明确的分界符,统计和使用语言模型非常直接,而对于中日韩泰等国语言,词与词之间没有明确的分隔符,因此首先需要对句子进行分析,才能做进一步的自然语言处理。
一般来讲,根据不同的应用,汉语分词的颗粒度大小应该不同。
比如在机器翻译中,颗粒度应该大一些,“北京大学”就不能分成两个词。
而在语音识别中,“北京大学”一般别分成两个词。
因此,不同的应用应该有不同的分词系统。
Goolge早起由于工程师少,没有精力开发,所以只能由别的公司进行开发了。
我对数学崇拜一直如此,所以在网上看完这一本书,我的真切体验正如吴军博士在书的后记中所说,把自己“境界提升了一个层次”。
那么,对我而言,到底提升了什么境界呢?
首要的肯定是思想境界。
在未读这本书之前,我知道对于这个世界的事件形成的信息集合,人类只有两种方式可以表达,一个是数字,一个是语言。
整个实数的集合是无穷个,而且每个数字都是唯一的;
整个世界中的事件也是无穷个的,而且每个事件也时独一无二的,这样数学中的数字集合与世界中的事件集合就构成一个一一对应的关系,所以研究数字之间的关系,实际上就是在研究世界中事件之间的关系。
语言中的概念和世界中的事件之间也是可以构成一个对应关系的,但问题是,语言中概念的集合是有限的,所以它和数字集合的对应显然只能是部分对应。
计算机科学的发展,人类需要把语言处理成数字,因为计算机只能识别数字信号,所以“语言的数字化”成为计算机产生以来发展最快、而且最有创新性的领域,而许多华人科学家成为了这个领域的顶尖专家,如李开复,吴军博士是卓越的科学家之一。
至此我才感到,在计算机主导的世界中,信息化就是数字化,而最难的数字化、也是最有成就的数字化,就是对人类自然语言的数字化,因为人类的信息几乎100%是用语言承载、传播的,计算机要与人对话,变成智能化的机器,首先要解决的就是语言的数字化问题。
但我们在电脑上自如地输入文字时、或者拿着手机通话时,我们跟本没有意识到,那些卓越的语言科学家,早已经把我们的语言,转化成数字信号,通过输入、处理、解码的方式,让我们无障碍地联络、工作。
我似乎感到,语言与数字的关系,就是人与自然关系的接口。
套用古希腊毕达哥拉斯学派的观点,加上我的理解,即是,数是万物的本原,语言是人的本原!
吴军博士似乎也在提升我对方法的认识境界。
科学研究的思考方式,习惯遵循本质、规律、连续性思维,在语言学研究的早期,人类为了让计算机识别语言,采用建立语言规则和语言规则数据库的办法,但最终以失败告终(20世纪50-70年代),70年代后科学家采用了语言统计模型,研究取得了突飞猛进。
语言统计模型的胜利,再一次证明了宇宙量子模型的信念,世界是不连续的随机性的粒子构成,人类数千年文明进化出来的语言系统,就是动态的随机概率事件。
其二,物理思维再也难逃牛顿的经典本质思维方法,即找寻到百分之百确定性的规律,而信息论思维是研究如何把握不确定性现象,利用概率统计是不二法门。
其三,语言本质上就是信息传播,只有从通信模型视角才能真正理解计算机的功能,对语言的编码、处理、传输、解码是计算机的强项,计算机是永远不可能理解语言的意思的。
在《数学之美》中,吴军博士对他的老师、师兄弟、同事的经历、掌故进行了叙述,让我们了解到这些世界一流的学科家、技术精英们的为人处世品质、鲜明个性、科学素养及其管理风格。
例如贾里尼克对博士生的严酷淘汰,马库斯对学生的宽宏大度,但我感到他们有一样东西是共同的,就是对科学创造、顶尖人才的识别和器重,甚至是无条件的包容。
如此为人的境界才是根本,因为伟大的科学创造毕竟是人做出来的,只有崇高的人文精神之下才能造就顶尖的人才、一流的科学和技术。
观国内的学说界,官风盛行、腐败当道、人情充斥,与这些一流学说群对科学创造的赏识、对个性人才的包容,对科学探索的热诚,可谓相去甚远。
谈到《数学之美》这一本书我们不得不提弗里德里克.贾里尼克博士,他当时在“谷歌黑板报”上发表“数学之美”系列文章时,为了引起读者的兴趣,介绍了一些成功地将数学原理应用自然语言处理领域的大师和学者。
单我根本的目的不是为了单纯讲故事,更不是为了聊八卦,而是为了有志于信息领域研究的年轻人介绍一批大师和成功者,让大家学习他们的思维方式,从而获得他们那样的成功。
在当今物欲横流的中国社会,学术界浮躁,年轻人浮躁,少数有着远大志向的年轻人实际上是非常孤独的。
弗里德里克.贾里尼克博士的做法让更多年轻的人看到了希望,让很多有梦想的人为了梦想而奋力拼搏,在我们当今的社会里,这中人已经很少了,我们需要他但是他却迟迟的没有出现。
我只希望我们的我们的身边有很多很多这样的人。
弗里德里克.贾里尼克出生于捷克克拉德诺的一个富有的犹太人家庭,他的父亲是一位牙科医生。
承袭了犹太民族的传统,他的父母从小就很注意他的教育,并且打算给送他到英国的公立学校读书,为了教他学习德语,还专门请了一位德国家庭女教师。
但是第二次世界大战完全打碎了他们的梦想,他们先是被从家中赶出去,流浪到布拉格。
他的父亲死在集中营,贾里尼克自己成天在街上玩,完全荒废了学业。
二战后,当他再度回到学校,他不仅要从小学补起,而且成绩一塌糊涂,全是D,但是很快他就赶上了班上的同学,不过他在小学从来没有得过A.从这个故事中可以看得出来没有什么可以阻挡天才前进的步伐,学习成绩不好一样可以出人头地的。
人的生活方式有两种,第一种是像草一样活着,你尽管活着,每年还在成长,但是你毕竟是一棵草,你吸收语录阳光,但是长不大,人们可以踩过你,但是人们不会因为你的痛苦他也产生痛苦,人们不会因为你被踩了,而来怜悯你,因为人们本来就没有看到你,所以我们每一个人都应该像树一样的成长,即使我们现在什么都不是,但是只要你是树的种子,即使被人踩到泥土中间,你依然能够吸收泥土的养分,自己成长起来,也许两年三年你长不大,但是八年,十年,二十年,你一定能长成参天大树,当你长成参天大树以后,遥远的地方,人们就能看到你,走近你,你能给人一片绿色,一片阴凉,你能帮助别人,即使人们离开你以后,回头一看,你依然是地平线上一道美丽的风景线,树,活着是美丽的风景,死了依然是栋梁之材,活着死了都有用,这就是我们每一个同学做人的标准和成长的标准。
?
我有一个比喻,每一条河流都有自己不同的生命曲线,每一条河流都有自己的梦想,那就是奔向大海,当我们遇到困难的时候,不管是冲过去还是绕过去,只要我们能过去就行,我希望大家能使自己的生命向梦想流过去,像长江黄河一样,能流到自己梦想的尽头,进入宽阔的海洋,使自己的事业也变得开阔,但是并不是说你想流就能流动过去的,其实这里面要具备一种精神,这就是水的精神,我们的生命有的时候会是泥沙,尽管你也跟着水一直往前流,但是由于你个性的缺陷,面对困难的腿部或者说胆怯,你可能慢慢的就会想泥沙一样,沉淀下去了,一旦你沉淀下去了,也许你不用再为了前进而努力了,但是你却永远见不到阳光了,上面的泥沙会不断的把你压住,最后你会暗无天日,所以我会建议大家,不管你现在的生命是怎么样的,一定要有水的精神,哪怕被污染了也能洗净自己,像水一样不断的继续自己的力量,不断的冲破障碍,当你发现时机不到的时候,把自己的厚度积累起来,当有一天时机来临的时候,你就能够奔腾入海成就自己的生命。
生命中四分之三的幸福和快乐。
有一次我在往黄河边上走的时候,我灌了一瓶子水,大家知道黄河的水特别浑,后来我就把它放在路边,大概有一个小时左右,我非常吃惊的发现,一瓶水的四分之三已经变成非常清澈的,而只有四分之一是沉淀下来的泥沙,假如说我们把这瓶水的清水部分比喻成我们的幸福和快乐,而把浑浊的泥沙比喻成我们的痛苦的话,你就明白了,当你摇晃一下以后,你的生命中整个充满的是浑浊,也就是充满痛苦和烦恼,但是当你把心静下来后,尽管泥沙总的分量一点都没有减少,但是它沉淀在你的心中,因为你的心比较沉静,所以就再也不会被搅和起来,因此你生命中的四分之三就一定是幸福和快乐。
所以不管道路如可的曲折与艰苦,我们一定要全力以赴,也许以前对自己不够严厉,不好好学习,但是读完了这本书这个故事真的让我受益匪浅,让我明白了很多人生中的道理。
明年就要毕业了,不管是在学校里还是在外面我要牢记这“越努力越幸运”这句话。
数学
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 读后感