统计史Word格式.docx
- 文档编号:15701723
- 上传时间:2022-11-15
- 格式:DOCX
- 页数:15
- 大小:38.64KB
统计史Word格式.docx
《统计史Word格式.docx》由会员分享,可在线阅读,更多相关《统计史Word格式.docx(15页珍藏版)》请在冰豆网上搜索。
统计学起源于定量地说明和研究社会经济问题。
它是帮助决策、辅助管理的工具。
统计学的发展过程大体可划分为三个阶段。
1.1第一阶段:
“城邦政情”(Mattersofstate)阶段
“城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。
他一共撰写了一百五十余种纪要,其内容包括各城邦的历史、行政、科学、艺术、人口、资源和财富等社会和经济情况的比较、分析,具有社会科学特征。
“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算术”这个名词所替代,并且很快被演化为“统计学”(Statistics)。
统计学依然保留了城邦(state)这个词根。
1.2第二阶段:
“政治算术”(Politcalarthmetic)阶段
“政治算术”阶段与“城邦政情”阶段并没有很明显的分界点,二者也没有很本质的差别。
“政治算术”的特点是统计方法与数学计算和推理方法开始结合。
分析社会经济问题的方式更加注重运用定量分析方法。
可以用1690年英国古典政治经济学的奠基人威廉·
配弟出版(政治算术)一书作为这个阶段的起始标志。
威廉·
配弟在书中强调了自己的立论方法,他说:
“我进行这种工作所使用的方法,在目前还不是常见的。
因为我不采用比较级或最高级的词语进行思辩式的议论,相反的采用了这样的方法,(作为我很久以来就想建立的政治算术的一个范例)即用数字、重量和尺度来表达自己想说的问题,只进行诉诸人们的感觉的议论,借以考察在自然中有可见根据的原因。
”
用数字、重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。
因此,威廉·
配弟的(政治算术)被后来的学者评价为近代统计学的来源,威廉·
配弟本人也被评价为近代统计学之父。
刺激近代统计学发展的主要原因是战争和工业革命。
当时政治家需要有人专门致力于收集和分析社会、经济和政治方面的统计资料,帮助他们决策和管理国家。
配弟写作(政治算术)大约在1671--1676年之间,正值爆发第三次英荷战争(1672--1674年)期间。
与此同时,他还撰写了(爱尔兰的政治解剖)一书。
在威廉·
配弟的心目中,政治算术和政治解剖这两种方法是二位体的。
有些学者认为(政治算术)是“比较统计”(Comparativstatistik),(爱尔兰的政治解剖)是“个别统计”(Einzelstatistik)。
构成“政治算术”方法的核心是“数字”。
配弟在书中使用的数字有三类:
第一类是对社会经济现象进行统计调查和经验观察得到的数字。
因为受历史条件的限制,书中通过严格的统计调查得到的数据少,根据经验得出的数字多;
第二类是运用某种数学方法推算出来的数字。
这类数据配弟在书中使用很多,其推算方法可分为三种:
“
(1)以已知数或已知量为基础,循着某种具体关系进行推算的方法;
(2)通过运用数字的理论性推理来进行推算的方法;
(3)以平均数为基础进行推算的方法”;
第三类是为了进行理论性推理而采用的例示性的数字。
配弟把这种运用数字和符号进行的推理称之为“代数的算法”。
从配弟使用数据的方法看,“政治算术”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点,统计实证方法和理论分析方法浑然一体,这种方法即使是现代统计学也依然继承。
1.3第三阶段:
“统计分析科学”(Scienceofstatisticalanalysis)阶段
在“政治算术”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。
十九世纪末,欧洲大学里开设的“国情纪要”或“政治算术”等课程名称逐渐消失,代之而起的是“统计分析科学”课程。
当时的“统计分析科学”课程的内容仍然是分析研究社会经济问题。
“统计分析科学”课程的出现是现代统计发展阶段的开端。
1908年,“学生”氏(WilliamSleeyGosset的笔名Student)发表了关于t分布的论文,这是一篇在统计学发展史上划时代的文章。
它创立了小样本代替大样本的方法,开创了统计学的新纪元。
现代统计学的代表人物首推比利时统计学家奎特莱(AdolpheQuelet),他将统计分析科学广泛应用于社会科学、自然科学和工程技术科学领域,因为他深信统计学是可以用于研究任何科学的一般研究方法。
现代统计学的理论基础概率论始于研究赌博的机遇问题,大约开始于1477年。
数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。
在概率论进一步发展的基础上,到十九世纪初,数学家们逐渐建立了观察误差理论、正态分布理论和最小平方法则。
于是,现代统计方法便有了比较坚实的理论基础。
2.统计学的发展过程
(2)
“统计”一词,英语为statistics,用作复数名词时,意思是统计资料,作单数名词时,指的是统计学。
一般来说,统计这个词包括三个含义:
统计工作、统计资料和统计学。
这三者之间存在着密切的联系,统计资料是统计工作的成果,统计学来源于统计工作。
原始的统计工作即人们收集数据的原始形态已经有几千年的历史,而它作为一门科学,还是从17世纪开始的。
英语中统计学家和统计员是同一个(statistician),但统计学并不是直接产生于统计工作的经验总结。
每一门科学都有其建立、发展和客观条件,统计科学则是统计工作经验、社会经济理论、计量经济方法融合、提炼、发展而来的一种边缘性学科。
2.1关于单词statistics
起源于国情调查,最早意为国情学。
十七世纪,在英格兰人们对“政治算术”感兴趣。
1662年,JohnGraunt发表了他第一本也是唯一一本手稿,《naturalandpoliticsobservationsuponthebillsofmortality》,分析了生男孩和女孩的比例,发展了现在保险公司所用的那种类型的死亡率表。
英文的statistics大约在十八世纪中叶由德国学者GottfriedAchenwall所创造,是由状态status和德文的政治算术联合推导得出的,第一次由JohnSinclair所使用,即1797年出现在EncyclopaediaBritannica。
(早期还有一个单词publicitics和statistics竞争“统计”这一含义,如果得胜,现在就开始流行publiciticallearning了)。
2.2关于高斯分布或正态分布
1733年,德-莫佛(DeMoivre)在给友人分发的一篇文章中给出了正态曲线(这一历史开始被人们忽略)
1783年,拉普拉斯建议正态曲线方程适合于表示误差分布的概率。
1809年,高斯发表了他的关于天体运行论的伟大著作,在这一著作的第二卷第三节中,他导出正态曲线适宜于表示误差规律,同时承认拉普拉斯较早的推导。
正态分布在十九世纪前叶因高斯的工作而加以推广,所以通常称作高斯分布。
卡尔-皮尔逊指出德-莫佛是正态曲线的创始人,第一个称它为正态分布,但人们仍习惯称之高斯分布。
2.3关于最小二乘法
1805年,Legendre提出最小二乘法,Gauss声称自己在1794年用过,并在1809年基于误差的高斯分布假设,给出了严格推导。
2.4其它
在十九世纪中叶,三个不同领域产生的重要发展都是基于随机性是自然界固有的这个前提上的。
阿道夫·
凯特莱特(A.Quetlet,1869)利用概率性的概念来描述社会学和生物学现象(正态曲线从观察误差推广到各种数据)
孟德尔(G.Mendel,1870)通过简单的随机性结构公式化了他的遗传法则
玻尔兹曼(Boltzmann,1866)对理论物理中最重要的基本命题之一的热力学第二定律给出了一个统计学的解释。
1859年,达尔文发表了《物种起源》,达尔文的工作对他的表兄弟高尔登爵士有深远影响,高尔登比达尔文更有数学素养,他开始利用概率工具分析生物现象,对生物计量学的基础做出了重要贡献(可以称他为生物信息学之父吧),高尔登爵士是第一个使用相关和回归这两个重要概念的人,他还是中位数和百分位数这种概念的创始人。
受高尔登工作影响,在伦敦的大学学院工作的卡尔-皮尔逊开始把数学和概率论应用于达尔文进化论,从而开创了现代统计时代,赢得了统计之父的称号,1901年Biometrika第一期出版(卡-皮尔逊是创始人之一)。
2.5关于总体和样本
在早期文献中可找到由某个总体中抽样的明确例子,然而从总体中只能取得样本的认识常常是缺乏的。
----K.皮尔逊时代
到十九世纪末,对样本和总体的区别已普遍知道,然而这种区分并不一定总被坚持。
----1910年Yule在自己的教科书中指出。
在1900年代的早期,区分变的更清楚,并在1922年被Fisher特别强调。
----Fisher在1922年发表的一篇重要论文中《Onthemathematicalfoundationoftheoreticalstatistics》,说明了总体和样本的联系和区别,以及其他概念,奠定了“理论统计学”的基础。
2.6期望、标准差和方差
期望是一个比概率更原始的概念,在十七世纪帕斯卡和费马时代,期望概念已被公认了。
K.皮尔逊最早定义了标准差的概念。
1918年,Fisher引入方差的概念。
力学中的矩和统计学中的中数两者之间的相似性已被概率领域的早期工作者注意到,而K.皮尔逊在1893年第一次在统计意义下使用“矩”。
2.7卡方统计量
卡方统计量,是卡-皮尔逊提出用于检验已知数据是否来自某一特定的随机模型,或已知数据是否与已给定的假设一致。
卡方检验被誉为自1900年以来在科学技术所有分支中20个尖端发明之一,甚至敌人Fisher都对此有极高评价。
2.8矩估计与最大似然
卡-皮尔逊提出了使用矩来估计参数的方法。
Fisher则在1912年到1922年间提出了最大似然估计方法,基于直觉,提出了估计的一致性、有效性和充分性的概念。
2.9概率的公理化
1933年,前苏联数学家柯尔莫格洛夫(Kolmogorov)发表了《概率论的基本概念》,奠定了概率论的严格数学基础。
2.10贝叶斯定理
贝叶斯对统计学几乎没有什么贡献,然而贝叶斯的一篇文章成为贝叶斯学派统计学的思想模式的焦点,这一篇文章发表于1763年,由贝叶斯的朋友、著名人寿保险原理的开拓者RichardPrice在贝叶斯死后提出来的----贝叶斯定理。
概率思想的两种方法,
(1)作为一个物理系统内在的一种物理特性,
(2)对某一陈述相信程度的度量。
在1950年代后期止,多数统计学家采取第一种观点,即概率的相对频数解释,这一时期贝叶斯定理仅应用在概率能在频数框架内解释的场合。
贝叶斯统计学派著作的一个浪潮始于1960年。
自此,赞成和反对贝叶斯学派统计的两方以皮尔逊和费舍尔所特有的激情和狂怒进行申辩和争辩。
在1960年以前,几乎所有的统计书刊都避免使用贝叶斯学派方法,Fisher坚持避免使用贝叶斯定理,并在他的最后一本书中再一次坚决的拒绝了它。
卡尔-皮尔逊偶然使用,总的来说是避免的。
奈曼和E.S.皮尔逊在他们有关假设检验的文章中坚决反对使用。
3.统计学的发展过程(3)
由于人类的统计实践是随着计数活动而产生的,因此,统计发展史可以追溯到远古的原始社会,也就是说距今足有五千多年的漫长岁月。
但是,能使人类的统计实践上升到理论上予以概括总结的程度,即开始成为一门系统的学科统计学,却是近代的事情,距今只有三百余年的短暂历史。
统计学发展的概貌,大
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计