t检验得资料与习题.docx
- 文档编号:1238824
- 上传时间:2022-10-19
- 格式:DOCX
- 页数:13
- 大小:30.93KB
t检验得资料与习题.docx
《t检验得资料与习题.docx》由会员分享,可在线阅读,更多相关《t检验得资料与习题.docx(13页珍藏版)》请在冰豆网上搜索。
t检验得资料与习题
第四章:
定量资料得参数估计与假设检验基础
1抽样与抽样误差
抽样方法本身所引起得误差。
当由总体中随机地抽取样本时,哪个样本被抽到就是随机得,由所抽到得样本得到得样本指标x与总体指标μ之间偏差,称为实际抽样误差。
当总体相当大时,可能被抽取得样本非常多,不可能列出所有得实际抽样误差,而用平均抽样误差来表征各样本实际抽样误差得平均水平。
σx=σ/
Sx=S/
2t分布
t分布曲线形态与n(确切地说与自由度v)大小有关。
与标准正态分布曲线相比,自由度v越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度v愈大,t分布曲线愈接近正态分布曲线,当自由度v=∞时,t分布曲线为标准正态分布曲线。
t=X-u/Sx=X-u/(S/),V=N-1
正态分布(normaldistribution)就是数理统计中得一种重要得理论分布,就是许多统计方法得理论基础。
正态分布有两个参数,μ与σ,决定了正态分布得位置与形态。
为了应用方便,常将一般得正态变量X通过u变换[(X-μ)/σ]转化成标准正态变量u,以使原来各种形态得正态分布都转换为μ=0,σ=1得标准正态分布(standardnormaldistribution),亦称u分布。
根据中心极限定理,通过上述得抽样模拟试验表明,在正态分布总体中以固定n,抽取若干个样本时,样本均数得分布仍服从正态分布,即N(μ,σ)。
所以,对样本均数得分布进行u变换,也可变换为标准正态分布N(0,1)
由于在实际工作中,往往σ就是未知得,常用s作为σ得估计值,为了与u变换区别,称为t变换,统计量t值得分布称为t分布。
假设X服从标准正态分布N(0,1),Y服从χ2(n)分布,那么Z=X/sqrt(Y/n)得分布称为自由度为n得t分布,记为Z~t(n)。
特征:
1.以0为中心,左右对称得单峰分布;
2.t分布就是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关。
自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线,如图、
t(n)分布与标准正态N(0,1)得密度函数
对应于每一个自由度ν,就有一条t分布曲线,每条曲线都有其曲线下统计量t得分布规律,计算较复杂。
学生得t分布(或也t分布),在概率统计中,在置信区间估计、显著性检验等问题得计算中发挥重要作用。
t分布情况出现时(如在几乎所有实际得统计工作)得总体标准偏差就是未知得,并要从数据估算。
教科书问题得处理标准偏差,因为如果它被称为就是两类:
(1)那些在该样本规模就是如此之大得一个可处理得数据为基础估计得差异,就好像它就是一定得
(2)这些说明数学推理,在其中得问题,估计标准偏差就是暂时忽略得,因为这不就是一点,这就是作者或导师当时得解释。
3、均数得参数估计
可信区间
按一定得概率或可信度(1-α)用一个区间来估计总体参数所在得范围,该范围通常称为参数得可信区间或者置信区间,预先给定得概率(1-α)称为可信度或者置信度,常取95%或99%。
1.点估计用样本统计量直接作为总体参数得估计值。
其方法简单,易于理解,但为考虑抽样误差得大小。
2.区间估计既按照预先给定得概率(1-a),确定得包含总体参数得可能范围。
该范围被称为总体参数得可信区间或置信区间。
假设检验基础
假设检验得基本思想就是小概率反证法思想。
小概率思想就是指小概率事件(P<0、01或P<0、05)在一次试验中基本上不会发生。
反证法思想就是先提出假设(检验假设H0),再用适当得统计方法确定假设成立得可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为不假设成立。
[2]
假设检验
假设就是否正确,要用从总体中抽出得样本进行检验,与此有关得理论与方法,构成假设检验得内容。
设A就是关于总体分布得一项命题,所有使命题A成立得总体分布构成一个集合h0,称为原假设(常简称假设)。
使命题A不成立得所有总体分布构成另一个集合h1,称为备择假设。
如果h0可以通过有限个实参数来描述,则称为参数假设,否则称为非参数假设(见非参数结果)。
如果h0(或h1)只包含一个分布,则称原假设(或备择假设)为简单假设,否则为复合假设。
对一个假设h0进行检验,就就是要制定一个规则,使得有了样本以后,根据这规则可以决定就是接受它(承认命题A正确),还就是拒绝它(否认命题A正确)。
这样,所有可能得样本所组成得空间(称样本空间)被划分为两部分HA与HR(HA得补集),当样本x∈HA时,接受假设h0;当x∈HR时,拒绝h0。
集合HR常称为检验得拒绝域,HA称为接受域。
因此选定一个检验法,也就就是选定一个拒绝域,故常把检验法本身与拒绝域HR
基本步骤
1、提出检验假设又称无效假设,符号就是H0;备择假设得符号就是H1。
H0:
样本与总体或样本与样本间得差异就是由抽样误差引起得;
H1:
样本与总体或样本与样本间存在本质差异;
预先设定得检验水准为0、05;当检验假设为真,但被错误地拒绝得概率,记作α,通常取α=0、05或α=0、01。
2、选定统计方法,由样本观察值按相应得公式计算出统计量得大小,如X2值、t值等。
根据资料得类型与特点,可分别选用Z检验,T检验,
3、根据统计量得大小及其分布确定检验假设成立得可能性P得大小并判断结果。
若P>α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能就是由于抽样误差造成得,在统计上不成立;如果P≤α,结论为按所取α水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能就是实验因素不同造成得,故在统计上成立。
P值得大小一般可通过查阅相应得界值表得到。
t检验 若总体服从正态分布N(μ,σ),但σ未知,记,,则t=遵从自由度为n-1得t分布,可对μ有以下得水平为α得检验,其中tα为自由度为n-1得t分布得上α分位数。
这些检验称为t检验。
第五章:
定量资料得t检验
前言:
T检验主要用于样本含量较小(例如n<30),总体标准差σ未知得正态分布资料。
t检验就是用t分布理论来推论差异发生得概率,从而比较两个平均数得差异就是否显著。
一、t检验分为单总体检验与双总体检验。
1、单总体t检验就是检验一个样本平均数与一个已知得总体平均数得差异就是否显著。
当总体分布就是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数得离差统计量呈t分布。
单总体t检验统计量为:
t:
为样本平均数与总体平均数得离差统计量
:
为样本平均数
μ:
为总体平均数
σx:
为样本标准差
n:
为样本容量
2、双总体t检验就是检验两个样本平均数与其各自所代表得总体得差异就是否显著。
双总体t检验又分为两种情况,一就是独立样本t检验,一就是配对样本t检验。
独立样本t检验统计量为:
S1与S2为两、样本方差;n1与n2为两样本容量。
(上面得公式就是1/n1+1/n2不就是减!
)
1/n1-1/n2得话无法计算相同得样本空间
配对样本t检验统计量为:
二、适用条件
(1)已知一个总体均数;
(2)可得到一个样本均数及该样本标准差;
(3)样本来自正态或近似正态总体。
三、t检验步骤
以单总体t检验为例说明:
问题:
难产儿出生体重n=35,=3、42,S=0、40,一般婴儿出生体重μ0=3、30(大规模调查获得),问相同否?
解:
1、建立假设、确定检验水准α
H0:
μ=μ0(零假设,nullhypothesis)
H1:
μ≠μ0(备择假设,alternativehypothesis,)
双侧检验,检验水准:
α=0、05
2、计算检验统计量
3、查相应界值表,确定P值,下结论
查附表1,t0、05/2、34=2、032,t
当总体呈正态分布,如果总体标准差未知,而且样本容量<30,那么这时一切可能得样本平均数与总体平均数得离差统计量呈t分布。
检验就是用t分布理论来推论差异发生得概率,从而比较两个平均数得差异就是否显著。
检验分为单总体t检验与双总体t检验。
四、t检验注意事项
1、选用得检验方法必须符合其适用条件(注意:
t检验得前提就是资料服从正态分布)。
理论上,即使样本量很小时,也可以进行t检验。
(如样本量为10,一些学者声称甚至更小得样本也行),只要每组中变量呈正态分布,两组方差不会明显不同。
如上所述,可以通过观察数据得分布或进行正态性检验估计数据得正态假设。
方差齐性得假设可进行F检验,或进行更有效得Levene's检验。
如果不满足这些条件,只好使用非参数检验代替t检验进行两组间均值得比较。
2、区分单侧检验与双侧检验。
单侧检验得界值小于双侧检验得界值,因此更容易拒绝,犯第Ⅰ错误得可能性大。
t检验中得p值就是接受两均值存在差异这个假设可能犯错得概率。
在统计学上上,当两组观察对象总体中得确不存在差别时,这个概率与我们拒绝了该假设有关。
一些学者认为如果差异具有特定得方向性,我们只要考虑单侧概率分布,将所得到t-检验得P值分为两半。
另一些学者则认为无论何种情况下都要报告标准得双侧t检验概率。
3、假设检验得结论不能绝对化。
当一个统计量得值落在临界域内,这个统计量就是统计上显著得,这时拒绝虚拟假设。
当一个统计量得值落在接受域中,这个检验就是统计上不显著得,这就是不拒绝虚拟假设H0。
因为,其不显著结果得原因有可能就是样本数量不够拒绝H0,有可能犯第Ⅰ类错误。
4、正确理解P值与差别有无统计学意义。
P越小,不就是说明实际差别越大,而就是说越有理由拒绝H0,越有理由说明两者有差异,差别有无统计学意义与有无专业上得实际意义并不完全相同。
5、假设检验与可信区间得关系结论具有一致性差异:
提供得信息不同区间估计给出总体均值可能取值范围,但不给出确切得概率值,假设检验可以给出H0成立与否得概率。
6、涉及多组间比较时,慎用t检验。
科研实践中,经常需要进行两组以上比较,或含有多个自变量并控制各个自变量单独效应后得各组间得比较,(如性别、药物类型与剂量),此时,需要用方差分析进行数据分析,方差分析被认为就是T检验得推广。
在较为复杂得设计时,方差分析具有许多t-检验所不具备得优点。
(进行多次得T检验进行比较设计中不同格子均值时)。
第六章定量资料得方差分析
6、1方差分析得基本思想与应用条件
6、1、1方差分析得基本思想
1、总变异
各样本数值与总均数不同。
总变异反映所有观察值得变异,量化值所有数据得均方MS总来表示。
SS总=Σ(X-Ẋ)2MS总=SS总/v总v总=N-1
2、组间变异
各组别间得均数不相同。
包括了变量影响与随机误差。
SS组间=Σni(Ẋi-Ẋ)2MS组间=SS组间/v组间v组间=k-1
3、组内变异
组内得个数值不同。
反映随机误差,又称误差变异。
SS组内=SS总-SS组间
MS组内=SS组内/v组内
V组内=N-k
F=MS组间/MS组内
6、1、2方差分析得应用条件
1、各样本相互独立切随机,服从正态分布。
2、总体方差相等,即方差齐性。
6、2完全随机设计资料得方差分析
6、2、1离均差平方与与自由度分解
(见6、1、1公式)
6、2、2完全随机设计资料方差分析得基本步骤
(1)建立假设检验,确定检验水准。
(2)计算检验统计量。
变异来源
SS
v
MS
F
P
总变异
——
组间变异
组内变异
(3)确定P值,做出推断结论。
6、3随机区组设计资料得方差分析
6、3、1离均差平方与与自由度得分解
SS总=SS处理+SS区组+SS误差
v总=v处理+v区组+v误差
变异来
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 检验 资料 习题