浅谈正态分布及应用.docx
- 文档编号:11467040
- 上传时间:2023-03-01
- 格式:DOCX
- 页数:8
- 大小:167.04KB
浅谈正态分布及应用.docx
《浅谈正态分布及应用.docx》由会员分享,可在线阅读,更多相关《浅谈正态分布及应用.docx(8页珍藏版)》请在冰豆网上搜索。
浅谈正态分布及应用
2010-2011-2
校选课《数学文化》
课程论文
浅谈正态分布及应用
学院(部):
机械工程学院
专业:
机械类
学生姓名:
班级:
学号
任课教师姓名:
职称
最终评定成绩
2011年5月
摘要
正态分布(normaldistribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
正态分布有极其广泛的实际背景,例如测量误差,人的生理特征尺寸如身高、体重等,正常情况下生产的产品尺寸:
直径、长度、重量高度,炮弹的弹落点的分布等,都服从或近似服从正态分布,以及确定医学参考值范围,药品规格,用量等。
可以说,正态分布是自然界和社会现象中最为常见的一种分布,一个变量如果受到大量微小的、独立的随机因素的影响,那么这个变量一般是一个正态随机变量。
关键词:
高斯分布、特征、转化、医学参考值
一、正态分布
(一)正态分布的由来
正态分布(normaldistribution)又名高斯分布(Gaussiandistribution)。
正态分布概念是由德国的数学家和天文学家Moivre于1733年受次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。
正态分布是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:
则其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。
因其曲线呈钟形,因此人们又经常称之为钟形曲线。
我们通常所说的标准正态分布是μ=0,σ=1的正态分布。
(二)正态分布的特性
如下图,正态分布的特征有:
(三)一般正态分布与标准正态分布的转化
由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x的概率。
只要会用它求正态总体在某个特定区间的概率即可。
“小概率事件”和假设检验的基本思想“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。
这种认识便是进行推断的出发点。
关于这一点我们要有以下两个方面的认识:
一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。
一般而言,都是应用公式进行转化。
(四)一般正态分布与标准正态分布的区别与联系
正态分布也叫常态分布,是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。
标准正态分布是正态分布的一种,具有正态分布的所有特征。
所有正态分布都可以通过Z分数公式转换成标准正态分布。
两者特点比较:
(1)正态分布的形式是对称的,对称轴是经过平均数点的垂线。
(2)中央点最高,然后逐渐向两侧下降,曲线的形式是先向内弯,再向外弯。
(3)正态曲线下的面积为1。
正态分布是一族分布,它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。
标准正态分布是正态分布的一种,其平均数和标准差都是固定的,平均数为0,标准差为1。
(4)正态分布曲线下标准差与概率面积有固定数量关系。
所有正态分布都可以通过Z分数公式转换成标准正态分布。
二、正态分布的应用
(一)综述
生活中各样各类的问题都可以用正态分布来解决或体现。
它主要包含这些方面:
1.估计频数分布一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。
2.制定参考值范围:
(1)正态分布法适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。
(2)百分位数法常用于偏态分布的指标。
3.质量控制:
为了控制实验中的测量(或实验)误差,常以作为上、下警戒值,以作为上、下控制值。
这样做的依据是:
正常情况下测量(或实验)误差服从正态分布。
4.正态分布是许多统计方法的理论基础。
检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。
许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。
(二)估计正态分布资料的频数分布
例1.10某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=172.70cm,标准差s=4.01cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;②分别求X+-1s、X+-1.96s、X+-2.58s范围内18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比较。
本例,μ、σ未知但样本含量n较大,按式(3.1)用样本均数X和标准差S分别代替μ和σ,求得u值,u=(168-172.70)/4.01=-1.17。
查附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到0.07,两者相交处为0.1210=12.10%。
该地18岁男大学生身高在168cm以下者,约占总数12.10%。
其它计算结果见表3。
表3100名18岁男大学生身高的实际分布与理论分布
分布 x+-s
身高范围
(cm)
实际分布
人数
实际分布 百分数(%)
理论分布(%)
X+-1s
168.69~176.71
67
67.00
68.27
X+-1.96s
164.84~180.56
95
95.00
95.00
X+-2.58s
162.35~183.05
99
99.00
99.00
(三)制定医学参考值范围
某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。
其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。
医学参考值范围亦称医学正常值范围。
它是指所谓“正常人”的解剖、生理、生化等指标的波动范围。
制定正常值范围时,首先要确定一批样本含量足够大的“正常人”,所谓“正常人”不是指“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群;其次需根据研究目的和使用要求选定适当的百分界值,如80%,90%,95%和99%,常用95%;根据指标的实际用途确定单侧或双侧界值,如白细胞计数过高过低皆属不正常须确定双侧界值,又如肝功中转氨酶过高属不正常须确定单侧上界,肺活量过低属不正常须确定单侧下界。
另外,还要根据资料的分布特点,选用恰当的计算方法。
常用方法有:
(1)正态分布法:
适用于正态或近似正态分布的资料。
双侧界值:
X+-u(u)^S单侧上界:
X+u(u)^S,或单侧下界:
X-u(u)^S
(2)对数正态分布法:
适用于对数正态分布资料。
双侧界值:
lg-1[X(lgx)+-u(u)S(lgx)];单侧上界:
lg-1[X(lgx)+u(u)S(lgx)],或单侧下界:
lg-1[X(lgx)-u(u)S(lgx)]。
常用u值可根据要求由表4查出。
(3)百分位数法:
常用于偏态分布资料以及资料中一端或两端无确切数值的资料。
双侧界值:
P2.5和P97.5;单侧上界:
P95,或单侧下界:
P5。
表4常用u值表
参考值范围(%)
单侧
双侧
80
0.842
1.282
90
1.282
1.645
95
1.645
1.960
99
2.326
2.576
结论
正态分布不仅仅应用在医学方面,在实际中处处都可以看到正态分布,如t分布、F分布、分布都是在正态分布的基础上推导出来的,u检验也是以正态分布为基础的。
机械加工中的测量误差,机械设计中的CPK,也都跟正态分布息息相关。
数学研究的最终目的是服务人类,正态分布的研究成果为当代人类的生活,科技都作出了巨大贡献。
参考文献:
【1】周勇、朱硕.线性代数:
复旦大学出版社;2010.
【2】张飞虎等.袁哲俊学术论文选集:
哈尔滨工业大学出版社;2006.
【3】Yihaizhiyuan.高斯分布:
CSDN空间;2011
【4】刘东南.线性代数讲义:
湖南工业大学;2010
本人签名:
曹为
日期:
2011、4、25
最终成绩评定表
学生姓名
学号
班级
学院
专业
论文名称
成绩评定标准
分值(总分100分)
论文格式符合要求。
20
概念清楚,思路清晰。
20
论点正确,实验方法科学。
20
语言表达准确,分析归纳合理。
20
结论严谨,论文观点有创新之处。
20
最终评定成绩
分数:
等级:
评分教师签名:
年月日
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 浅谈 正态分布 应用