中山大学生物统计学考试复习Word文档下载推荐.docx
- 文档编号:17841979
- 上传时间:2022-12-11
- 格式:DOCX
- 页数:19
- 大小:190.69KB
中山大学生物统计学考试复习Word文档下载推荐.docx
《中山大学生物统计学考试复习Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《中山大学生物统计学考试复习Word文档下载推荐.docx(19页珍藏版)》请在冰豆网上搜索。
2.是一种理论概率分布
3.随机变量是样本统计量样本均值,样本比例和样本方差等
4.结果来自容量相同的所有可能样本
样本均值的均值(数学期望)等于总体均值
样本均值的方差等于总体方差的1/n
样本均值的抽样分布规律:
当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值
也服从正态分布,
的数学期望为μ,方差为σ2/n。
即
~N(μ,σ2/n)
中心极限定理:
设从均值为μ,方差为σ2的一个任意总体中抽取容量为n的样本,当n充分大时(n>
30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布
四.样本方差的抽样分布(Pearson)
设总体服从正态分布N(μ,σ2),X1,X2,…,Xn为来自该正态总体的样本,则样本方差S2的分布为
,将
称为自由度为(n-1)的卡方分布
均值的标准误
五.两个样本方差比的分布(R.A.Fisher)
设X1,X2,…,Xn1是来自于一个正态分布总体X~N(μ1,σ12)的一个样本,Y1,Y2,…,Yn2是来自正态总体Y~N(μ2,σ22)的一个样本,且Xi(i=1,2,…,n1),Yi(i=1,2,…,n2)相互独立,则
将F(n1-1,n2-1)称为第一自由度为(n1-1),第二自由度为(n2-1)的F分布
六.T统计量的分布(WillamSealyGosset)
设X1,X2,…,Xn是来自正态总体N(μ1,σ12)的一个样本,称
为统计量,它服从自由度为n-1的t分布
⏹假设检验、参数估计相关概念(例如独立样本、配对样本、Aspin-Welch检验法、方差齐性检验)
独立样本
配对样本
Aspin-Welch检验法两个总体均值之差的t检验(σ12、σ22未知但不相等)
1.检验具有等方差的两个总体的均值
2.假定条件
–
两个样本是独立的随机样本
–两个总体都是正态分布
–两个总体方差未知但不相等σ12≠σ22
3.近似t检验,Aspin-Welch检验法,检验统计量
方差齐性检验
⏹ANOVA,LSD法,随机误差和系统误差,因素和水平
⏹ANOVA
1.检验多个总体均值是否相等
▪通过对各观察数据误差来源的分析来判断多个总体均值是否相等
2.变量
⏹1个定类尺度的自变量
•2个或多个(k个)处理水平或分类
⏹1个定距或定比尺度的因变量
3.用于分析完全随机化试验设计
LSD法
随机误差
在因素的同一水平(同一个总体)下,样本的各观察值之间的差异
系统误差
在因素的不同水平(不同总体)下,各观察值之间的差异
因素
所要检验的对象称为因素或因子
水平
因素的具体表现称为水平
⏹相关和回归分析及与之关联的概念
例如
⏹总体(Population)
⏹所关心的所有元素的集合
⏹样本(Sample)
⏹总体的一部分
⏹参数(Parameter)
⏹总体的数字特征
⏹统计量(Statistic)
⏹样本的概括性测度值
2简答题
统计数据的如何收集与整理?
抽样调查
1.从总体中随机抽取一部分单位(样本)进行调查
2.目的是推断总体的未知数字特征
3.最常用的调查方式
4.具有经济性、时效性强、适应面
广、准确性高等特点
5.从总体中随机抽取一部分单位(样本)进行调查
6.目的是推断总体的未知数字特征
7.最常用的调查方式
8.具有经济性、时效性强、适应面
重点调查和典型调查
1.重点调查
从调查对象的全部单位中选择少数重点单位进行调查
调查结果不能用于推断总体
2.典型调查
从调查对象的全部单位中选择少数典型单位进行调查
目的是描述和揭示事物的本质特征和规律
统计报表
1统计调查方式之一
2过去曾经是我国主要的数据收集方式
3按照国家有关法规的规定、自上而下地统一布置、自下而上地逐级提供基本统计数据
4有各种各样的类型
⏹
统计数据的初步处理
一频数表和频数图
二整理和展示数据
定序数据的整理(可计算的指标)
1.累计频数:
将各类别的频数逐级累加
2.累计频率:
将各类别的频率(百分比)逐级累加
3.图形:
累计频数分布图、环形图
定类数据的整理
1.列出各类别
2.计算各类别的频数
3.制作频数分布表
4.用图形显示数据(条形图和饼图)
频数分布表的编制数据类型及图示
频数分布的类型
⏹点估计的常见方法及应用
点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等
⏹如何区分假设检验问题?
决策:
双尾检验H0:
m=H1:
m≠
研究:
将认为研究结果是无效的说法或理论作为H0;
是把希望证明的有效假设作为H1;
先确立H1
声明:
将所作出的声明作为H0,对该说明的质疑作为H1;
先确立H0
除非我们有证据表明“声明”无效,否则就应认为该“声明”是有效的
⏹介绍两种以上多重比较方法
Fisher提出的最小显著差异方法,简写为LSD,该方法可用于判断到底哪些均值之间有差异
⏹分子生物学方差分析的作用和意义?
⏹数据缺失如何处理?
为何要进行数据的变换?
P171
⏹相关系数的其它计算形式
⏹聚类分析的思想和步骤
a)对数据进行变换;
b)定义样品间的距离(如欧氏距离)、类别之间的距离(如最短距离);
c)首先将t个样品各自视为一类:
得到初始的分类G
(1)(含有t类),计算t个样品两两之间的距离,它们等价于初始的类间距离,得到初始的距离矩阵D
(1);
d)将距离最近的两类合并为一新类,得到新的分类G
(2)(含有t-1类),并计算新类与其它类的类间距离,得到新的类间距离矩阵D
(2),再按照最小距离准则并类,得到G(3)(含有t-2类)、D(3),…。
直到所有样品都并成一类;
画出谱系聚类图,决定分类的个数及各类的成员。
⏹Stata的背景和功能,操作特点和心得
3计算题
⏹区间估计
一.总体均值的区间估计(σ2已知)
1.假定条件
总体服从正态分布,且总体方差(σ2)已知
如果不是正态分布,可以由正态分布来近似(n≥30)
2.使用正态分布统计量
3.总体均值μ在1-α置信水平下的置信区间为
二.总体均值的区间估计(σ2未知)
总体方差(σ2)未知
总体必须服从正态分布
1.使用t分布统计量
2.总体均值在1-置信水平下的置信区间为
三.总体比例的区间估计
两类结果
总体服从二项分布
可以由正态分布来近似
1.使用正态分布统计量
2.总体比例P的置信区间为
三.样本容量的确定
估计总体均值时样本容量的确定
1.根据均值区间估计公式可得样本容量
其中:
2.样本容量n与总体方差s2、允许误差D、可靠性系数Z之间的关系为
与总体方差成正比
与允许误差成反比
与可靠性系数成正比
估计总体比例时样本容量的确定
1.根据比例区间估计公式可得样本容量
2.若总体比例P未知时,可用样本比例
来代替
第四节两个总体均值及两个总体比例之差的估计
一.两个总体均值之差估计(σ12,σ22已知)
1.假定条件
两个总体都服从正态分布
若不是正态分布,可以用正态分布来近似(n1≥30和n2≥30)
2.两个独立样本均值之差的抽样分布服从正态分布,其期望值为
其标准误差为
3.使用正态分布统计量
4.两个总体均值之差μ1-μ2在1-α置信水平下的置信区间为
二.两个总体均值之差估计(σ12,σ22未知,但相等)
σ12,σ22未知,但相等
2.总体方差σ2的联合估计量为
3.估计量`x1-`x2的标准差为
4.使用t分布统计量
5.两个总体均值之差1-2在1-置信水平下的置信区间为
自由度
三.两个总体均值之差估计(σ12,σ22未知,且不相等)
12、22未知,且1222
2.使用的统计量为
3.两个总体均值之差1-2在1-置信水平下的置信区间为
四.两个总体比例之差估计
两个总体是独立的
两个总体服从二项分布
可以用正态分布来近似
2.两个总体比例之差P1-P2在1-α置信水平下的置信区间为
第五节正态总体方差及两正态总体方差比的区间估计
一.正态总体方差的区间估计
1.估计一个总体的方差或标准差
2.假设总体服从正态分布
3.总体方差σ2的点估计量为S2,且
4.总体方差在1-a置信水平下的置信区间为
二.两个正态总体方差比的区间估计
1.比较两个总体的方差比
2.用两个样本的方差比来判断
如果S12/S22接近于1,说明两个总体方差很接近
如果S12/S22远离1,说明两个总体方差之间存在差异
3.总体方差比在1-置信水平下的置信区间为
⏹一般假设检验问题的计算
一.总体方差已知时的均值检验(双尾Z检验)
总体服从正态分布
若不服从正态分布,可用正态分布来近似(n³
30)
2.原假设为:
H0:
m=m0;
备择假设为:
H1:
m¹
m0
3.使用Z-统计量
总体方差已知时的均值检验(单尾Z检验)
–总体服从正态分布
–若不服从正态分布,可以用正态分布来近似(n³
2.备择假设有<
或>
符号
3.使用Z-统计量
二.总体方差未知时的均值检验(t检验)
–总体为正态分布
–如果不是正态分布,只有轻微偏斜和大样本(n³
30)条件下
2.使用t-统计量
三.总体比例的假设检验(Z检验)
–有两类结果
–总体服从二项分布
–可用正态分布来近似
2.
P0为假设的总体比例
比例检验的Z-统计
一.总体方差的检验(χ2检验)
1.检验一个总体的方差或标准差
2.假设总体近似服从正态分布
3.原假设为H0:
s2=s02
S2样本方差;
σ2假设的总体方差
4.检验统计量
第三节两个正态总体的参数检验
一.两个总体参数之差的抽样分布
二.两个总体均值之差的Z检验(σ12、σ22已知)
–两个样本是独立的随机样本
–若不是正态分布,可以用正态分布来近似(n1³
30和n2³
2.原假设:
m1-m2=0;
备择假设:
m1-m2¹
0
3.检验统计量为
两个总体均值之差的t检验((σ12、σ22未知但相等)
两个总体方差未知但相等σ12=σ22
3.检验统计量
两个总体均值之差的t检验(σ12、σ22未知但不相等)
4.检验具有等方差的两个总体的均值
5.假定条件
6.近似t检验,Aspin-Welch检验法,检验统计量
三.假设检验中相关样本的利用
两个相关(配对或匹配)样本的均值检验
四.两个总体比例之差的检验(配对样本的t检验)
1.检验两个相关总体的均值
–配对或匹配
–重复测量(前/后)
2.利用相关样本可消除项目间的方差
3.假定条件
–两个总体都服从正态分布
–如果不服从正态分布,可用正态分布来近似(n1³
30,n2³
30)
统计量
55
自由度df=nD-1
样本均值
样本标准差
两个总体比例之差的检验(Z检验)
–两个总体是独立的
–两个总体都服从二项分布
–可以用正态分布来近似
2.检验统计量
⏹单因素方差分析问题计算和检验
提出假设
●H0:
m1=m2=…=mk(因素有k个水平)
●H1:
m1,m2,…,mk不全相等
构造检验统计量
1.为检验H0是否成立,需确定检验的统计量
2.构造统计量需要计算
总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系
SST=SSE+SSA
SSA的均方也称为组间方差,记为MSA,计算公式为
SSE的均方也称为组内方差,记为MSE,计算公式为
统计决策
将统计量的值F与给定的显著性水平的临界值F进行比较,作出接受或拒绝原假设H0的决策
▪根据给定的显著性水平,在F分布表中查找与第一自由度df1=k-1、第二自由度df2=n-k相应的临界值F
▪若F>
F,则拒绝原假设H0,表明均值之间的差异是显著的,所检验的因素(A)对观察值有显著影响
▪若FF,则不能拒绝原假设H0,表明所检验的因素(A)对观察值没有显著影响
⏹相关系数计算
1.
三.相关系数的显著性检验
1.检验两个变量之间是否存在线性相关关系
2.等价于对相关系数的检验
3.采用t检验
4.检验的步骤为
1.提出假设:
H0:
;
H1:
0
2.计算检验的统计量:
3.确定显著性水平,并作出决策
1.若t>
t,拒绝H0
2.若t<
t,接受H0
1.若︱r︱大于表上的=0.05相应的值,小于表上的=0.01相应的值,称变量x与y之间有显著的线性关系
2.若︱r︱大于表上=0.01相应的值,称变量x与y之间有十分显著的线性关系
3.若︱r︱小于表上=0.05相应的值,称变量x与y之间没有明显的线性关系
⏹一元线性回归计算和检验
SST=SSR+SSE
检验的步骤
1.提出假设
▫H0:
线性关系不显著
2.计算检验统计量
3.确定显著性水平,并根据分子的自由度1和分母自由度n-2找出临界值F
4.作出决策:
若FF,拒绝H0;
若F<
F,接受H0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中山大学 生物 统计学 考试 复习