第四章正态分布体育统计学docxWord格式文档下载.docx
- 文档编号:14822181
- 上传时间:2022-10-25
- 格式:DOCX
- 页数:17
- 大小:24.22KB
第四章正态分布体育统计学docxWord格式文档下载.docx
《第四章正态分布体育统计学docxWord格式文档下载.docx》由会员分享,可在线阅读,更多相关《第四章正态分布体育统计学docxWord格式文档下载.docx(17页珍藏版)》请在冰豆网上搜索。
如果随机变量X的概率密度函数为
y=12e(x22)2(x
)(4—1)
—
则称随机变量X是服从正态分布的由上式绘出的图形叫做正态曲线。
(图4—2)X的变动范围在至+间。
Y
μ
X
图4—2
正态分布曲线
正态分布曲线中有两个参数:
均值及方差2。
为了应用方
便,对式(4—1)中的随机变量经过一个称为标准化的变换,即令
u来代替原式中的
,寻这时的随机变量
u的概率密度函数成
为:
y=
12eu2
(4—2)
按照(4—2)式绘出的图形,称作标准正态曲线。
(图4—3)
0.4
0.3
0.2
0.1
-3-2-10123μ
欢迎下载2
图4—3标准正态分布曲线
第二节正态分布曲线的特征
正态分布曲线有许多特点,它们对实际工作有很大的帮助。
它的主要特点有以下几个方面:
一,正态分布的形式是对称的(但对称的分布不一定是正态分
布)。
在正态分布中均值与中位数相重合。
二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以
后又再次减慢,最后接近横轴,但终究不能与横轴相交。
三,从中央向两侧逐渐下降,它的方向是先向内弯,达到离均值
左右各一个标准差时又改向外弯,是以1的点为曲线从内弯转
向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。
四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相
等,各相当距离间的面积相等,而且各相当距离间的曲线高度也相等,正态曲线下(与横轴间)的总面积为1.00。
五,正态曲线可以有不同形式,它们的均值和标准差可以不相同,
均值不同表明曲线在横轴上所处位置不同,标准差不同表明曲线的形
态不同。
标准差小则曲线高、且窄;
标准差大则曲线低、且宽。
4—4)由式(4—1)和(4—2)知,标准正态曲线的=0,=
1,即标准正态曲线是关于纵轴对称;
它在=0时,有最大值,
它近似等于0.4,如(图4—3)所示。
欢迎下载3
σ=0.5
σ=1
σ=2
图4—4三种不同形式的正态分布曲线
第三节正态分布表
从某市17岁男生中随机抽出205人测量身高,由这个样本计算得到X=168.40厘米,S=6.13厘米。
假定该市17岁男生身高服从正态分布,试估计身高在16.40—172.40厘米之间的人数。
求解这类问题的一般方法是:
求从正态总体中随机选取一个个体的测量值落在区间(a,b)上的概率。
这个概率在标准正态曲线下就
是曲线、X轴、直线X=a和X—b所围成的面积。
(图4—5)当概率P求得后,要求的人数约等于总人数乘以P值。
-3
-2
-1
0a1b2
欢迎下载4
图4—5随机变量X在区间(a,b)内取值的概率示意图
表的左边第1列这横轴上的位置,它是指横轴上某一点与平均值的距离,以标准差为单位来表示,通常记为u,即
u=x
(4—3)
表上边的第1行为u值的第2位小数。
表的主体部分是各u值与均数(u=0)之间所对应的单侧面积(或概率)。
一、知U值求对应的面积
例4—1求u值为-1至+2之间对应的面积。
解:
由于标准正态曲线是关于x=u对称的均数处的u值为零,
所以u值在-1至0这间对应的面积与它在0至+1之间的对应面
积相等。
查书后附表1得u值在-1至0的对应面积是34.13%;
u值在0至+2之间的面积是47.72%。
前者在均值的左边,后者在均值的右边,因此这两块面积之和便是所求面积。
(图4—6)即:
34.13%+47.72%=81.85%
81.85%34.13%47.72%
-102=-10+02
图4—6
例4—2本节开始提出的问题,即试估计身高在160.40—
172.40厘米之间的人数。
首先要求出身高为160.40厘米和172.40厘米的u值,按式
(4—3)有(当u和未知时,可用X和S近似代替):
欢迎下载5
u1=160.40168.40=-1.31
6.13
u2=172.40168.40=0.65
查书后附表1求u1、u2所对应的面积。
u1=-1.31所对应的面积
是40.49%,u2=0.65所对应的面积是24.22%。
u值-1.31至0.65
所对应的面积为40.49%+24.22%=64.71%,见(图4—7)所示,
于是身高在160.40—172.40厘米之间的人数约为205×
64.71%
133(人)。
24.22%
40.49%
-1.31
0.65
-2-1
012
160.40米
172.40米
图4-7
估计身高在
160.40-172.40厘米间的人数百分数
二、已知面积求对应的U值
例4—3试求从+1向右到什么位置对应的面积为
14.15%?
设从+1向右到+k对应的面积为14.15%。
查标准正
态分布表知+1对应的面积是34.13%。
24.13%+14.15%=48.28%,
就是u值从0到+k之间对应的面积。
查书后附表1和K=2.11,
即从+1向右到+2.11之间对应的面积为14.15%。
(图4—8)
从标准正态分布表中,可以找出标准正态曲线下面的分布规律。
在下表中列出的五个分布位置与其对应的概率是统计中电子学用到的,应该熟记。
欢迎下载6
μ+1б+2.11б
图4—8从+1—+2.11对应的面积
表4—1正态曲线下的概率分布
u
该范围具有的概率
68.26%
1.96
95.00%
95.44%
2.58
99.00%
99.73%
第四节统计资料的正态性检验
正态分布的理论适用于正态或近似正态分布的资料。
对样本要想用正态分布理论进行分析,首先要检验样本是否为正态分布。
检验的方法有多种,简单而实用的方法是“概率格纸绘图法”。
这种方法使用的概率纸是正态概率纸,它的横轴是普通的刻度,纵轴是按正态分
欢迎下载7
布的规律刻划的。
使用时,先根据样本数据求出累计频率,然后根据
累计频率和组限,将其点绘在正态概率纸上,如果样本资料是呈正态分布的则所有点几乎在一条直线上。
例4—4广州市某中学初中生800米跑的抽样测验成绩的累计频率如下表所示,试检验该资料是否近似正态分布?
组限
频数
累计频数
累计频率(%)
237
0.8
244
5.
251
15
22
17.
258
20
42
33.
305
27
69
55.
312
25
94
75.
319
21
115
92.
326
121
96.
333
123
98.
340
125
100.
由样本计算得:
X=3032,S=124
然后根据每组的下限值和相应的累计频率,将它们分别标在图上。
根
据点的分布趋势画一直线,观察这些点的分布是否接近一条直线。
在画直线时应以靠近中部的点为主,两端的点为辅,因为中部的点的组
频数大,所以占比重也大。
由(图4—9)可见,所有的点几乎都在一条直线上,故该样本资料接近于正态分布。
欢迎下载8
99
95
90
80
70
60
50
40
30
15.87
2′50″9μ3′02″8′
0.01
2′37″2′44″2′51″2′58″3′05″3′12″3′19″3′26″3′33″
图4—9
当样本资料符合正态分布时,籍助正态概率纸做图,还可以对
和作出近似地估计。
从正态分布理论知道累积频率为50%的位
置应在中点,即接近均数位置。
从纵轴50%的位置画横线与钭线交
于a点,由不得a点向横轴做垂线交于点,其值为3028,
即为估计均数,它与计算值3022仅相差05。
又知均数减一个标准差位置的面积为34.13%,故在纵轴上的应是50%-34.13%=15.87%(b点),以此划横线交于钭线上c点,向横灿做垂线交于2509处,此点距均数的长度应为,故估计标准差的值为:
30282509119。
计算值为124,仅相差05。
只要图做得准确,这些估计值也还是比较精确的。
欢迎下载9
第五可疑数据的舍取
在工作中,往往能本料中具有个突出的数(特大或特小的数)。
按本数据系列大小序来看,些突出的数和其他数之有明脱象。
种象使人疑些特数是否属于研究的体,于是把些数据称可疑数据。
人把来自非同一体的极端,称异常数据。
本中的异常数据当及剔除,否会影响本均数和准差等量及算果的准确性。
如何判断可疑数据是否异常数据,方法不少,下面介适用于
正分布,且数据个数不多,比常用而有效的戈伯斯(Grubbs)法。
x1,x2⋯⋯,xn来自正分布的体,将它按大小重新排列
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 正态分布 体育 统计学 docx