数值变量资料的统计推断_精品文档.pptx

文档编号：2565233
上传时间：2022-11-01
格式：PPTX
页数：87
大小：923.50KB

《数值变量资料的统计推断_精品文档.pptx》由会员分享，可在线阅读，更多相关《数值变量资料的统计推断_精品文档.pptx（87页珍藏版）》请在冰豆网上搜索。

数值变量资料的统计推断_精品文档.pptx

1一、均数抽样误差和标准误一、均数抽样误差和标准误二、二、tt分布分布三、总体均数估计三、总体均数估计四、假设检验四、假设检验第三节第三节参数估计和假设检验参数估计和假设检验2样样样样本本本本总体总体总体总体样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量例如：

样本均例如：

样本均值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方差差差差差差总体均值、比总体均值、比总体均值、比总体均值、比例、方差等例、方差等例、方差等例、方差等现实中的研究过程现实中的研究过程3统计推断统计推断采用抽样研究的方法，由某总体中随机抽取一个采用抽样研究的方法，由某总体中随机抽取一个有代表性的样本，并根据样本提供的信息（统计量）有代表性的样本，并根据样本提供的信息（统计量）推断总体特征、性质（参数）的过程称为统计推断推断总体特征、性质（参数）的过程称为统计推断statisticalinference4统计推断统计推断统计推断包括两个重要的方面：

统计推断包括两个重要的方面：

o一是利用样本统计量的信息对相应总体参数一是利用样本统计量的信息对相应总体参数值做出推断，如用样本均数估计总体均数，值做出推断，如用样本均数估计总体均数，用样本标准差估计总体标准差等，称之为参用样本标准差估计总体标准差等，称之为参数估计数估计o另一个是利用样本统计量来推断我们是否接另一个是利用样本统计量来推断我们是否接受一个事先关于总体的假设，称之为假设检受一个事先关于总体的假设，称之为假设检验验5使用样本统计量过程中的问题使用样本统计量过程中的问题o不同的研究者对相同的总体作类似的抽样研不同的研究者对相同的总体作类似的抽样研究可能会得到不同的样本统计量究可能会得到不同的样本统计量o各自用样本统计量估计总体的参数，样本统各自用样本统计量估计总体的参数，样本统计量与总体参数间是否完全相等？

如何评价计量与总体参数间是否完全相等？

如何评价他们的准确性？

他们的准确性？

6o已知某地高中三年级男生的身高满足正态分布，已知某地高中三年级男生的身高满足正态分布，其平均身高为其平均身高为168.15厘米，这里，将该地高中三厘米，这里，将该地高中三年级男生的身高视为一个总体。

现从该总体中年级男生的身高视为一个总体。

现从该总体中随机抽样随机抽样5次，每次抽取一个样本含量次，每次抽取一个样本含量n=10的样的样本，得到的本，得到的5个样本的数据及各样本均数如下：

个样本的数据及各样本均数如下：

一、均数抽样误差和标准误一、均数抽样误差和标准误7样本号样本号样本含量样本含量（n=10）m=168.15m=168.15cm样本样本均数均数1161.1173.7173.7167.3162.2162.2166.6166.6157.4157.4164.822166.8159.1159.1166.1173.3173.3169.1169.1165.2165.2166.633157.4174.0172.3175.8166.6182.1163.1159.4159.4177.3168.744174.5182.1168.5171.3174.1165.6173.7171.9167.5164.1171.335164.1166.6169.6169.6173.8173.2164.3166.6182.1165.4169.538o各个样本均数之间都不相同各个样本均数之间都不相同抽样误差表现形式之抽样误差表现形式之一一o各个样本均数都不等于总体均数，有的比总体均数大，各个样本均数都不等于总体均数，有的比总体均数大，有的比它小有的比它小抽样误差表现形式之二抽样误差表现形式之二o相对于各样本的个体值，样本均数间的变异程度较小相对于各样本的个体值，样本均数间的变异程度较小样本均数的特点样本均数的特点9样本均数的抽样分布样本均数的抽样分布o仍以某地高三男生的身高为例，设身高变量仍以某地高三男生的身高为例，设身高变量为为x，假定，假定x服从正态分布，记为服从正态分布，记为xN（168.15,62）o从总体从总体X中反复随机抽样，样本含量分别为中反复随机抽样，样本含量分别为n=4，n=16和和n=36，分别随机抽，分别随机抽10000个样本个样本并计算样本均数，把同一样本含量的并计算样本均数，把同一样本含量的10000个个样本均数视为一个新的样本资料作频数图样本均数视为一个新的样本资料作频数图10从正态分布总体从正态分布总体N（168.15,62）中随机抽样中随机抽样10000次的结果次的结果曲线是正态总体曲线是正态总体N（168.15,62）的概率密度曲线的概率密度曲线直方图为正态分布总体直方图为正态分布总体N（168.15,62）的样本均数的频率密度图的样本均数的频率密度图样本含量样本含量n=36样本含量样本含量n=16样本含量样本含量n=411o大多数的样本均数相互之间存在差异，绝大多数的样本均大多数的样本均数相互之间存在差异，绝大多数的样本均数不等于数不等于x的总体均数的总体均数o样本均数的集中趋势位置与个体资料样本均数的集中趋势位置与个体资料x的集中趋势位置较的集中趋势位置较为接近，样本均数的频数图均呈现出中间多、两边少且基为接近，样本均数的频数图均呈现出中间多、两边少且基本对称的正态分布特征。

本对称的正态分布特征。

o样本均数的分布范围较个体值小；随着样本含量的增大，样本均数的分布范围较个体值小；随着样本含量的增大，样本均数的频数分布范围越来越窄样本均数的频数分布范围越来越窄o每种样本量的每种样本量的10000个样本均数值所计算出的样本均数的个样本均数值所计算出的样本均数的标准差都非常接近标准差都非常接近（为个体资料为个体资料x的总体标准差，的总体标准差，n为为个体数个体数）样本均数的分布规律样本均数的分布规律12理论上可以证明：

从正态分布的总体理论上可以证明：

从正态分布的总体中随机抽取样中随机抽取样本含量为本含量为n的一批样本，样本均数的一批样本，样本均数有如下性质有如下性质：

o样本均数样本均数服从正态分布服从正态分布oo样本均数样本均数的总体均数为的总体均数为样本均数的分布规律样本均数的分布规律13样本均数的标准误样本均数的标准误o为了与个体的标准差相互区别，样本均数的标准差又称为为了与个体的标准差相互区别，样本均数的标准差又称为样本均数的标准误样本均数的标准误standarderror,SE，或理论标准误，或理论标准误o反映了样本均数间的离散程度，如果反映了样本均数间的离散程度，如果SE很大则不同的样本很大则不同的样本均数间参差不齐，同时样本均数的分布范围较大，也反映均数间参差不齐，同时样本均数的分布范围较大，也反映了样本均数与总体均数间的差异可能较大，因而标准误反了样本均数与总体均数间的差异可能较大，因而标准误反映均数抽样误差的大小；它与总体标准差成正比，与总体映均数抽样误差的大小；它与总体标准差成正比，与总体中的个体数的平方根成反比中的个体数的平方根成反比o代表样本均数的标准误，其表达式为代表样本均数的标准误，其表达式为14均数的标准误的影响因素均数的标准误的影响因素o从标准误的计算公式中看出它与原先个体观察值的总体标准差从标准误的计算公式中看出它与原先个体观察值的总体标准差有关，同时也和样本含量有关，同时也和样本含量n有关有关o在固定样本含量的情况下，总体标准差越大，则样本均数间越在固定样本含量的情况下，总体标准差越大，则样本均数间越参差不齐，抽样误差越大；但是总体标准差是参数，在抽样之参差不齐，抽样误差越大；但是总体标准差是参数，在抽样之前就已经存在，无法改变它的大小前就已经存在，无法改变它的大小o故可行的方法是通过扩大样本含量减少标准误；从而减少抽样故可行的方法是通过扩大样本含量减少标准误；从而减少抽样误差误差15均数标准误的估计值均数标准误的估计值由于在实际研究中，我们往往只抽一次样，得到由于在实际研究中，我们往往只抽一次样，得到一个样本均数，而且大多数情况下一个样本均数，而且大多数情况下未知未知,此时常用此时常用样本标准差样本标准差SS估计总体标准差估计总体标准差，这样我们就得到，这样我们就得到样本均数标准误的估计值样本均数标准误的估计值抽样误差越小，表示样本均数与总体均数越接近，抽样误差越小，表示样本均数与总体均数越接近，用样本均数估计总体均数的可靠性越高；反之则越用样本均数估计总体均数的可靠性越高；反之则越低低16例：

例：

o2000年某研究者随机调查某地健康成年女性年某研究者随机调查某地健康成年女性248人，人，得到血红细胞的均数为得到血红细胞的均数为4.181012/L，标准差为，标准差为0.281012/L，试估计该样本的抽样误差？

，试估计该样本的抽样误差？

17二、二、t分布分布对于某个资料，其个体变量对于某个资料，其个体变量服从正态分布，记作：

服从正态分布，记作：

总体总体总体总体个体值正态分布个体值正态分布18u值标准正态分布值标准正态分布对服从正态分布的个体变量值对服从正态分布的个体变量值作下列转换：

作下列转换：

变量值变量值u也服从正态分布，记作也服从正态分布，记作个体变量值个体变量值个体变量值个体变量值经过经过经过经过ZZZZ转换后的变量转换后的变量转换后的变量转换后的变量值值值值uuuu1111、uuuu2222、uuuu333319样本均数正态分布样本均数正态分布总体总体总体总体样样样样本本本本样样样样本本本本样样样样本本本本样样样样本本本本20样本均数样本均数u转换标准正态分布转换标准正态分布样样样样本本本本样样样样本本本本样样样样本本本本u1u2u321既往资料表明某市区新生女婴的平均出生体重既往资料表明某市区新生女婴的平均出生体重为为3.10kg，标准差为，标准差为0.59kg。

某研究者从该市区。

某研究者从该市区中随机抽取一个由中随机抽取一个由100个女婴组成的样本，请问个女婴组成的样本，请问出现样本均数超过出现样本均数超过2.87kg算不算是小概率事件？

算不算是小概率事件？

22样本均数标准正态性转换中的实际问题样本均数标准正态性转换中的实际问题o要对样本均数进行要对样本均数进行u转换，必须要知道总体的标准差转换，必须要知道总体的标准差；但是在实际的情况下，并没有对总体中所有的个；但是在实际的情况下，并没有对总体中所有的个体进行观察，所以无法得知体进行观察，所以无法得知；而且通常我们也只作；而且通常我们也只作一次抽样研究，只能得到一次抽样研究，只能得到s，只能用样本标准误的估，只能用样本标准误的估计值计值估计估计o那么那么是否仍然满足标准正态分布？

是否仍然满足标准正态分布？

o假定假定，我们比较一下，我们比较一下u与与u之间是否存之间是否存在不同在不同23o在正态总体在正态总体N（168.18,62）中随机抽样，样本量分别取中随机抽样，样本量分别取n=5，n=100，均抽，均抽10000个样本，分别计算个样本，分别计算u值和值和u值，其结果如下：

值，其结果如下：

样本量样本量统计量统计量平均值平均值P2.5P97.5n=5u0.0149031-1.9500671.969157u0.0319309-2.6542142.838163n=100u0.0033231-1.9508861.971245u0.0347047-1.9811832.000407uvs.u24样本含量样本含量n=5样本含量样本含量n=100（a）（b）u统计量的频数分布图统计量的频数分布图（10000个样本个样本）,轮廓曲线为标准正态分布轮廓曲线为标准正态分布u曲线曲线25o上述上述10000个样本所计算出的个样本所计算出的u值和值和u值的平均值都非常接近标准值的平均值都非常接近标准正态分布的集中位置正态分布的集中位置0o对于对于u值而言，无论值而言，无论n=5和和n=100，u值的值的P2.5和和P97.5都十分接近标都十分接