《数学之美》读书笔记

时间：2024-07-09 17:55:25 阅读全文下载本文

《数学之美》读书笔记4篇

当仔细品读一部作品后，相信大家都有很多值得分享的东西，此时需要认真思考读书笔记如何写了哦。那么如何写读书笔记才能更有感染力呢？以下是小编为大家收集的《数学之美》读书笔记，供大家参考借鉴，希望可以帮助到有需要的朋友。

《数学之美》读书笔记1

《数学之美》是一本领域相关的数学概念书，生动形象地讲解了关于数据挖掘、文本检索等方面的基础知识，可以作为数据挖掘、文本检索的入门普及书。另外，就像作者吴军老师提到的，关键是要从中学到道————解决问题的方法，而不仅仅是术。书中也启发式的引导读者形成自己解决问题的道。

下面记录一下自己读这本书的一些感想：

第一章《文字和语言vs数字和信息》：文字和语言中天然蕴藏着一些数学思想，数学可能不仅仅的是一门非常理科的知识，也是一种艺术。另外，遇到一个复杂的问题时，可能生活中的一些常识，一些简单的思想会？给你带来解决问题的灵感。

第二章《自然语言处理————从规则到统计》：试图模拟人脑处理语言的模式，基于语法规则，词性等进行语法分析、语义分析的自然语言处理有着很大的复杂度，而基于统计的语言模型很好的解决了自然语言处理的诸多难题。人们认识这个过程，找到统计的方法经历了20多年，非常庆幸我们的前辈已经帮我们找到了正确的方法，不用我们再去苦苦摸索。另外，这也说明在发现真理的过程中是充满坎坷的，感谢那些曾经奉献了青春的科学家。自己以后遇到问题也不能轻易放弃，真正的成长是在解决问题的过程中。事情不可能一帆风顺的，这是自然界的普遍真理吧！

第三章《统计语言模型》：自然语言的处理找到了一种合适的方法———基于统计的模型，概率论的知识开始发挥作用。二元模型、三元模型、多元模型，模型元数越多，计算量越大，简单实用就是最好的。对于某些不出现或出现次数很少的词，会有零概率问题，这是就要找到一数学方法给它一个很小的概率。以前学概率论的时候觉的没什么用，现在开始发现这些知识可能就是你以后解决问题的利器。最后引用作者本章的最后一句话：数学的魅力就在于将复杂的问题简单化。

第四章《谈谈中文分词》：中文分词是将一句话分成一些词，这是以后进一步处理的基础。从开始的查字典到后来基于统计语言模型的分词，如今的中文分词算是一个已经解决的问题。然而，针对不同的系统、不同的要求，分词的粒度和方法也不尽相同，还是针对具体的问题，提出针对该问题最好的方法。没有什么是绝对的，掌握其中的道才是核心。

第五章《隐马尔科夫模型》：隐马尔科夫模型和概率论里面的马尔科夫链相似，就是该时刻的状态仅与前面某几个时刻的状态有关。基于大量数据训练出相应的隐马尔科夫模型，就可以解决好多机器学习的问题，训练中会涉及到一些经典的算法（维特比算法等）。关于这个模型，没有实际实现过，所以感觉好陌生，只是知道了些概率论讲过的原理而已。

第六章《信息的度量和作用》：信息论给出了信息的度量，它是基于概率的，概率越小，其不确定性越大，信息量就越大。引入信息量就可以消除系统的不确定性，同理自然语言处理的大量问题就是找相关的信息。信息熵的物理含义是对一个信息系统不确定性的度量，这一点与热力学中的熵概念相同，看似不同的学科之间也会有着很强的相似性。事务之间是存在联系的，要学会借鉴其他知识。

第七章《贾里尼克和现代语言处理》：贾里尼克是为世界级的大师，不仅在于他的学术成就，更在于他的风范。贾里尼克教授少年坎坷，也并非开始就投身到自然语言方面的研究，关键是他的思想和他的道。贾里克尼教授治学严谨、用心对待自己的学生，对于学生的教导，教授告诉你最多的是“什么方法不好”，这很像听到的一句话“我不赞同你，但我支持你”。贾里克尼教授一生专注学习，最后在办公桌前过世了。读了这章我总结出的一句话是“思想决定一个人的高度”。在这章中对于少年时的教育，以下几点值得借鉴：1、少年时期其实没有必要花那么多时间读书，他们的社会经验、生活能力以及在那时树立起的志向将帮助他们一生。2、中学时花大量时间学会的内容，在大学用非常短的时间就可以读完，因为在大学阶段，人的理解力要强很多。3、学习（和教育）是一个人一辈子的过程。4、书本的内容可以早学，也可以晚学，但是错过了成长阶段却是无法补回来的。

第八章《简单之美————布尔代数和搜索引擎的索引》：布尔是19世纪英国的一位中学教师，但他的公开身份是啤酒商，提出好的思想的人不一定是大师。简单的建立索引可以根据一个词是否在一个网页中出现而设置为0和1，为了适应索引访问的速度、附加的信息、更新要快速，改进了索引的建立，但原理上依然简单，等价于布尔运算。牛顿的一句话“（人们）发觉真理在形式上从来是简单的，而不是复杂和含混的”。做好搜索，最基本的要求是每天分析10—20个不好的搜索结果，积累一段时间才有感觉。有时候，学习、处理问题，可以从不好的方面入手，效果可能更好。

第九章《图论和网络爬虫》：图的遍历分为“广度优先搜索（Breadth—First Search，简称BFS）”和“深度优先搜索（Depth—First Search，简称DFS）。互联网上有几百亿的网页，需要大量的服务器用来下载网页，需要协调这些服务器的任务，这就是网络设计和程序设计的艺术了。另外对于简单的网页，没必要下载。还需要存储一张哈希表来记录哪些网页已经存储过（如果记录每个网页的url，数量太多，这里可以用后面提到的信息指纹，只需要一个很多位的数字即可），避免重复下载。另外，在图论出现的很长一段时间里，实际需求的图只有几千个节点，那时图的遍历很简单，人们都没有怎么专门研究这个问题，随着互联网的出现，图的遍历一下子有了用武之地，很多数学方法就是这样，看上去没有什么用途，等到具体的应用出来了一下子开始派上大用场了，这可能就是世界上很多人毕生研究数学的原因吧。一个系统看似整体简单，但里面的每个东西都可能是一个复杂的东西，需要很好的设计。

第十章《PageRank————Google的民主表决式网页排名技术》：搜索返回了成千上万条结果，如何为搜索结果排名？这取决与两组信息：关于网页的质量信息以及这个查询和每个网页的相关性信息。PageRank算法来衡量一个网页的质量，该算法的思想是如果一个网页被很多其他网页所链接，说明它收到普遍的承认和信赖，那么它的排名就高。谷歌的创始人佩奇和布林提出了该算法并用迭代的方法解决了这个问题。PageRank在Google所有的算法中依然是至关重要的。该算法并不难，可是当时只有佩奇和布林想到了，为什么呢？

第十一章《如何确定网页和查询的相关性》：构建一个搜索引擎的四个方面：如何自动下载网页、如何建立索引、如何衡量网页的质量以及确定一个网页和某个查询的相关性。搜索关键词权重的科学度量TF—IDF，TF衡量一个词在一个网页中的权重，即词频。I ……此处隐藏4455个字……本书介绍数学理论在互联网上的运用，平时我们在使用互联网搜索或者翻译功能的时候，时常会感叹电脑对自己的了解和它的聪明，其实背后的原理就是一个个精美的算法和大量数据的训练。那些或者熟悉或者陌生的数学知识（联合概率分布，维特比算法，期望最大化，贝叶斯网络，隐形马尔可夫链，余弦定律，etc），一步步构建了我们现在所赖以生存的网上世界。

之所以觉得自己早已身不在起点，是因为上面这些数学知识，早已经不在我的知识框架之内，就算曾经学过，也不过是囫囵吞枣一样的强记硬背，没有领会过其中的真正意义。而今天想重头在来学一次，其实已经不可能了。且不说要花费多少的精力和时间，还需要的是领悟力。而这一些，已经不是我可以简单付出的。

不像物理、化学需要复杂的实验来验证，很多数学的证明，几乎只要有一颗聪明的头脑和无数的草稿纸，可是光是这颗聪明的头脑，就可以阻拦掉很多人。有人说多读书就会聪明，我不否认，书本的确会提供很多知识，可是不同的人读同一本书也会有不同的收货，这就限制于每个人的知识框架和认知水平。就如一个数学功底好过我的人，看这本书，就会更容易理解里面的公式和推导出这些公式的其他运用点，而我，只能站在数学的门口，感叹一句，它真的好美吧。

当然，我暂时无法在实际生活中运用这些数学公式，可是书中提到的一些方法论，还是很有帮助的

1）一个产业的颠覆或者创新，大部分来自于外部的力量，比如用统计学原理做自然语言处理。

2）基础知识和基础数据是很重要性，只有足够多和足够广的数据，才可以提供有效的分析，和验证分析方法的好坏。

3）先帮用户解决80%的问题，在慢慢解决剩下的20%的问题；

4）不要等一个东西完美了，才发布；

5）简单是美，坚持选择简单的做法，这样会容易解释每一个步骤和方法背后的道理，也便于查错。

6）正确的模型也可能受噪音干扰，而显得不准确；这时不应该用一种凑合的修正方法加以弥补，而是要找到噪音的根源，从根本上修正它。

7）一个人想要在自己的领域做到世界一流，他的周围必须有非常多的一流人物。

《数学之美》读书笔记4

读完本书，第一感受：次奥！原来数学如此多的原理模型概念都可以用去解决各种IT技术问题啊。特别是语言识别和自然语言处理这类问题完全就是建立在数学原理之上的。总之，这本书就是用非常深入浅出的话去说明如何用数学方法去解决计算机的各种工程问题。这是一本讲道，而不是术的书。要完全读懂这本书，我觉得至少需要掌握这三门课：高等数学，离散数学，还有概率论与数理统计。唉..我当初数学学得太水了，还挂了高数啊...有好的概念没看懂，以后有时间在好好看吧。如果想搞计算机研究的话，数学基础必不可少，别总在抱怨各种数学课上的东西一辈子都用不着。

发现作者对人类自然发展的认识非常深，其从语言，文字，数学的产生发展，信息的传播记录得出了这个结论：信息的产生传播接收反馈，和今天最先进的通信在原理上没有任何差别。就算是科学上最高深的技术，那也是模拟我们生活中的一些基本原理。

我们今天使用的十进制，就是我们扳手指扳了十次，就进一次位。而玛雅文明他们数完了手指和脚指才开始进位，所以他们用的是二十进制。实际上阿拉伯数字是古印度人发明的，只是欧洲人不知道这些数字的真正发明人是古印度，而就把这功劳该给了“二道贩子”阿拉伯人。

语言的数学本质

任何一种语言都是一种编码方式，比如我们把一个要表达的意思，通过语言一句话表达出来，就是利用编码方式对头脑中的信息做了一次编码，编码的结果就是一串文字，听者则用这语言的解码方法获得说话者要表达的信息。

自然语言处理模型

计算机是很笨的，他们唯一会做的就是计算。自然语言处理在数学模型上是基于统计的，说一个句子是否合理，就看看他出现的可能性大小如何，可能性就是用概率来衡量，比如一个句子，出现的概率为1/10^10,另一个句子出现的概率为1/10^20,那么我们就可以说第一个句子比第二个句子更加合理。当然这要求有足够的观测值，他有大数定理在背后支持。

最早的中文分词方法

这句话：“同学们呆在图书馆看书”，如何分词？应该是这样：同学们/呆在/图书馆/看书.最先的方法是北航一老师提出的查字典方法，就是把句子从左道右扫描一遍，遇到字典里面出现的词就标示出来，遇到复合词如（北京大学）就按照最长的分词匹配，遇到不认识的字串就分割成单个字，于是中文的分词就完成了。但是这只能解决78成的分词问题，但是“像发展中国家”这种短语它是分不出来的。后来大陆用基于统计语言模型方法才解决了。

隐含马可夫模型（没这么看懂）

一直被认为是解决打多数自然语言处理问题最为快速有效的方法，大致意思是：随机过程中各个状态的概率分布，只与他的前一个状态有关。比如对于天气预报，我们只假设今天的气温只与昨天有关而与前天没有关系，这虽然不完美，但是以前不好解决的问题都可以给出近视值了。

一个让我印象深刻的观点：

小学生和中学生其实没有必要花那么多时间去读书，其觉得最主要的是孩子们的社会经验，生活能力，和那时候树立起来的志向，这将帮助他们一生。而中学生阶段花很多时间比同伴多读的课程，在大学以后可以用非常短的时间就可以读完。因为在大学阶段，人的理解能力要强很多，比如中学要花500小时才能搞明白的内容，大学可能花100小时就搞定了。学习和教育是一个人一辈子的事情，很多中学成绩好的人进入大学后有些就表现不太好了，要有不断学习的动力才行。

余弦定理和新闻分类

我在新浪干过一年多新闻，这篇认真看了一篇，很吃惊原理cos x与新闻分析也有关系啊。google的新闻服务是由计算机自动整理分类的。而传统的媒体如门户网站是让编辑读懂新闻，找到主题，再分类分级别的，真苦逼啊...计算机自动分类原理是这样：如一篇新闻有10000个词，组成一个万维向量，这个向量就代表这篇新闻，可以通过某种算法表达这个新闻主题的类型，如果两个向量的方向一致，说明对应的新闻用词一致，方向可用夹角表示，夹角可用余弦定理表示，所以当夹角的余弦值接近于1时，这两篇新闻就可以归为一类了。

没看懂的东西：

布尔代数：布尔代数把逻辑学和数学合二为一，给了我们一个全新的视角看世界...

网络爬虫的基本原来是利用了图论的广度优先搜索和深度优先搜索...

搜索引擎的结果排名用了稀疏矩阵的计算...

地图最基本的计算是利用了有限状态机和图论的最短路径...

密码学原理，最大熵模型，拼音输入法的数学模型，布隆过滤器，贝叶斯网络等等...

任何事物都有它的发展规律，当我们认识了规律后，应当在生活工作中遵循规律，希望大家透过IT规律的认识，可以举一反三的总结学习认识规律，这样有助于自己的境界提升一个层次。

任何问题总是能找到相应的准确数学模型，一个正确的数学模型在形式上应当是简单的，一个好的方法在形式上应当也是简单的。简单才是美。