多元统计期末复习题.docx
- 文档编号:9660448
- 上传时间:2023-02-05
- 格式:DOCX
- 页数:8
- 大小:22.44KB
多元统计期末复习题.docx
《多元统计期末复习题.docx》由会员分享,可在线阅读,更多相关《多元统计期末复习题.docx(8页珍藏版)》请在冰豆网上搜索。
多元统计期末复习题
多元统计期末复习题
多元数据分析练习题 第二章多元正态的参数估计 一.判断题 若X?
(X1,X2,?
Xp)T~Np(?
?
),?
是对角矩阵,则X1,X2,?
Xp相互独立。
多元正态分布的任何边缘分布为正态分布,反之也成立。
对任意的随机向量X?
(X1,X2,?
Xp)来说,其协方差矩阵?
是对称矩阵,并且总是半正定的。
对标准化的随机向量来说,它的协方差矩阵与原来变量的相关系数阵相同。
若X?
(X1,X2,?
Xp)X,1nTT~Np(?
?
),X,S分别为样本均值和样本协差阵,则 S分别为?
?
的无偏估计。
二.计算题 ?
16?
T1.假设随机向量X?
(X1,X2,X3)的协方差矩阵为?
?
?
4?
?
?
3?
?
1?
1数矩阵R。
R?
?
?
?
2?
1?
?
?
4?
1?
13121?
4?
?
1?
?
?
3?
1?
?
?
T?
44?
23?
?
2,试求相关系?
9?
?
2.假设随机向量x?
(x1,x2)的协方差矩阵为?
?
?
T?
9?
1?
?
20?
1,令 y1?
2x1?
x2,y2?
x1?
x2,试求y?
(y1,y2)的协方差矩阵。
?
60?
?
?
?
?
3?
327?
?
?
?
?
?
?
?
3.假设12?
1?
~N3(?
?
),A?
?
?
?
,其中?
?
(1,2,?
1)T, ?
2?
?
?
1?
?
?
11?
?
?
2?
?
4?
2?
?
?
1,试求y?
Ax的分布。
N2(?
?
0?
?
?
?
?
22?
?
)?
?
?
?
?
4?
?
三.证明题 1.设X
(1),X
(2),?
X(n)是来自Np(?
?
)的随机样本,X为样本均值。
试证明:
E(X)?
?
,D(X)?
1n?
。
1n?
12.设X
(1),X
(2),?
X(n)是来自Np(?
?
)的随机样本, E(1n?
1S)?
?
。
试证明:
S为样本协差阵。
3.证明:
若p维正态随机向量X?
(X1,X2,?
Xp)?
的协差阵为对角矩阵,则X的各分量是相互独立的随机变量。
第四章判别分析 一.判断题 1.从某种意义上讲,距离判别是Bayes判别的一种特例。
2.距离判别的思想是分别计算样本到各个总体的欧几里得距离,根据距离的大小判别样本属于哪个总体。
3.量纲的变化对欧几里得距离的计算结果有影响,而马氏距离则克服了这种影响。
欧氏距离是马氏距离的一种特例。
4.贝叶斯判别法是一种考虑了总体出现的先验概率和误判损失的判别方法。
5.在贝叶斯判别法中,R?
(R1,R2,?
Rk)是一个划分,hi(x)是将样品误判给总体Gi的加权平均损失,则Ri?
{xhi(x)?
minhj(x)},i?
1,2,?
k。
1?
j?
k6.费希尔判别法是借助方差分析的思想构造线性判别函数,使得总体之间区别最大,而使每个个体内部的离差最小。
二.计算题 1.设有两个正态总体G1,G2,已知:
?
(1)?
?
?
?
(2)?
?
?
?
1?
?
?
2?
5?
?
3?
?
?
2?
?
2?
?
32?
?
4?
1?
?
?
?
?
2?
?
11?
?
4?
?
?
?
建立距离判别法的判别准则; ?
1?
X?
判断:
样品:
?
?
,应归属于哪一类?
x?
G2 ?
3?
D(x,G1)?
1813(4x1?
3x2?
4x1x2?
4x1?
22x2?
51),22 (x1?
4x2?
2x1x2?
10x1?
28x2?
52)222.设G1,G2为两个二元总体,从中分别抽取容量为3的样本如下:
x1 x23 72 4 :
G14 7 x1 x26 95 7 :
G24 8求两样本的样本均值x
(1),x
(2)及协方差矩阵S1,S2; ?
2TTx
(1)?
(3,6),x
(2)?
(5,8)S1?
?
?
3?
3?
?
2?
?
S?
2?
?
16?
?
1?
?
?
2?
假定两总体协方差矩阵相等,记为?
,用S1,S2联合估计?
; ?
1?
?
2?
?
1?
1?
?
11?
2?
1?
?
?
?
?
?
?
?
?
2?
2?
?
11?
建立距离判别法则; W(x1,x2)?
?
2(x1?
3x2?
25),W(x1,x2)?
0,x?
G1;W(x1,x2)?
0,x?
G2 TT假设有一新样品x0?
(x1,x2)?
(2,7),进行距离判别。
x?
G2 3.已知两总体的概率密度分别为f1(x)和f2(x),且总体的先验分布为p1?
p2?
,误判损失为c(21)?
50,c(12)?
100。
建立Bayes判别准则; 假设有一新样品x0满足f1(x0)?
和f2(x0)?
,判定x0的归属问题。
4.假设两总体G1,G2的概率密度分别为f1(x)?
1?
x,x?
1和f2(x)?
1?
x?
?
?
x?
。
做出f1(x)和f2(x)的图像。
若假定先验概率p1?
p2,c(21)?
c(12),求Bayes判别区间的临界点; 若p1?
p2?
,c(21)?
c(12),求Bayes判别区间的临界点;5.假定有G1,G2,G3三个组,已知p1?
p2?
p3?
,f1(x0)?
和 f2(x0)?
,f3(x0)?
。
若不计误判损失,判定x0属于哪个组;假定误判代价矩阵为G1误判为G2G3真实组G1G2c(11)?
0c(12)?
20c(21)?
10c(22)?
0c(31)?
200c(32)?
100 G3c(13)?
60c(23)?
50c(33)?
0判定x0属于哪个组。
6.已知两总体的概率密度分别为f1(x)和f2(x),且总体的先验分布为p1?
p2?
,误判损失为c(21)?
4,c(12)?
12。
建立Bayes判别准则; 假设有一新样品x0满足f1(x0)?
和f2(x0)?
,判定x0的归属问题。
7.假设先验概率,误判代价及概率密度值已列于下表。
试用贝叶斯判别法将样品分到组 G1,G2,G3中的一个。
若不考虑误判代价,则判别结果又将如何?
G1判别为G2G3真实组G1G2G3c(11)?
0c(12)?
400c(13)?
100p1?
f1(x0)?
c(21)?
20c(22)?
0c(23)?
50p2?
f2(x0)?
c(31)?
80c(32)?
200c(33)?
0p3?
f3(x0)?
先验概率概率密度8.金融分析员需要有两项重要指标来衡量,设总体G1为“金融分析员满足要求”;总体G2为“金融分析员不满足要求”,今测得两个总体的若干数据,并这些数据得到 ?
?
?
?
?
?
?
1?
?
?
?
?
2?
?
?
?
?
?
?
?
6?
?
2?
2411?
?
4?
T?
1假设对某一金融分析员进行测量得到两个指标为x?
(5,4),判别这一分析员是否能满足这项工作。
当两组先验概率分别为q1?
q2?
,损失相同。
问该金融分析员满足要求吗?
为什么?
第五章聚类分析 一.判断题 1.快速聚类分析中,分类的个数是确定的,不可改变。
均值聚类分析中,样品一旦划入某一类就不可改变。
3.判别分析,聚类分析和主成分分析都不要求数据来自正态总体。
4.系统聚类可以对不同的类数产生一系列的聚类结果。
5.K均值聚类和系统聚类一样,可以用不同的方法定义点点间的距离。
6.K均值聚类和系统聚类一样,都是以距离的远近亲疏为标准进行聚类的。
二.计算题 1.下面是5个样品两两间的距离矩阵 ?
0?
40?
?
?
690?
?
1710?
635?
?
?
?
?
?
?
0?
?
D(0)08试用最长距离法作系统聚类,并画出谱系聚类图。
2.假设有6个样本,每个样本只测量一个指标,数据如表。
样本点间使用绝对值距离,类 间使用最长距离,利用系统聚类法对这6个样本进行分类。
要求:
写出距离矩阵及类的合并过程; 画出聚类的谱系图; 写出样本分成两类时的结果。
样本编号123456指标11243-4-23.假定我们对A,B,C三个样品分别测量两个变量X1和X2得到结果如表:
用快速聚类法将以上样品聚成两类。
样品ABCX15-11变量X2312 4.检验某产品的重量,抽了6个样品,每个样品只测了一个指标,分别为1,2,3,6,9,11,试用最短距离法,重心法进行聚类分析。
?
0?
105.考虑下列4个样品的距离矩阵:
?
?
112?
?
53?
?
?
,用最短距离,最长距离法和类平均法?
?
0?
04对这4个样品进行聚类,并画出谱系图。
6.有8个样本,每个样本两个指标,数据如表。
样本点间使用欧氏距离,类间使用最短距离法,利用系统聚类法对这8个样本进行分类。
样本编号指标1指标21252233444435-436-227-328-1-3
7.检验某产品的重量,抽了5个样品,每个样品只测了一个指标,分别为1,2,6,11,试用快速聚类法将样品分为两类。
三.简答题 1.判别分析与聚类分析有何区别?
判别分析是对于n个给定的样本,已知每个样本属于k个类别中的某一类,利用这些数据,找到一种判别方法,使得这种判别方法具有某种最优性质,能把属于不同种类的样本点尽可能的区别开来,并对测得同样指标数据的新样本,能够判别这个样本归属于哪一类。
聚类分析是在样品和类之间定义一种距离,按照距离的大小对样品进行聚类,距离相近的样品先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品总能聚到合适的类中。
聚类分析没有判别函数,对新的样品无法判别它应该归属哪一类,必须重新进行聚类过程,才能判别它属于哪类。
系统聚类分析能够得到样品从最小的分类到最大的分类的情况,而判别分析没有这种功能,但判别分析的距离判别法与聚类分析非常相似,也是根据距离的远近判别样本的归属问题。
均值法与系统聚类法的异同 K均值法事先必须确定分类的个数,分类的个数确定,而系统聚类分析系统聚类分 析能够得到样品从最小的分类到最大的分类的情况,可以根据需要将样品分为几类。
K均值法可以随意将样品分为K类,根据样品到类中心的距离远近重新进行分类, 而系统聚类中样品一旦划入某一类就不能更改。
K均值法样品与不同类间的距离采用点到类中心的平方欧氏距离,而系统聚类中点 间距离有很多种定义方法。
3.简述系统聚类法的思想。
4.简述快速聚类法的思想。
第六章主成分分析 一.判断题 1.主成分分析数学模型中的正交变换,在几何上就是做一个坐标旋转。
2.假设X1,X2,...,Xp为某实际问题所涉及的p个变量,Y1,Y2,...,Yp是其p个主成分, 判断下列说法是否正确:
原始变量X1,X2,...,Xp的协方差矩阵和相关矩阵出发,求得的主成分是一致的。
对变量做主成分分析之前,必须对原始数据进行标准化。
标准化数据的协方差矩阵出发求得的主成分与原始数据的相关系数矩阵出发求得的主成分一致。
Cov(Yi,Yj)?
0,i?
j。
于Y1,Y2,...,Yp包含原始变量的信息量递减,因而实际应用中选取前几个主成分代替原来的原始变量。
当各个变量取值范围相差不大或者是度量单位相同的指标时,一般选择直接从协方差矩阵求解。
pp?
Var(Yi)?
i?
1?
Var(Xi?
1pi)。
假设X1,X2,...,X的协方差矩阵为?
,?
1,?
2,...,?
m为?
的非零特征根, T则第i个主成分为Yi?
?
iX,i?
1,2,...,m。
?
i,i?
1,2,...,m为对应的单位化的特征向量, Yi是X1,X2,...,Xp的线性组合。
D(Yi)?
?
i,i?
1,2,...,p。
主成分的协方差矩阵是对角阵。
方差贡献率表明了主成分综合原始变量的能力。
3.主成分分析中的信息,是用变量期望的大小来表示的。
二.计算题 1.假设总体X?
(X1,X2)T的协方差矩阵为?
?
?
主成分Y1的累计贡献率。
?
1?
?
?
?
?
T2.假设总体X?
(X1,X2,X3)的相关矩阵为R?
?
1?
,(?
1?
?
?
1)求X的标准 ?
?
?
?
?
?
1?
?
?
5?
22?
?
,求X的主成分Y1,Y2,并计算第一2?
化变量的主成分Y1,Y2,Y3,并计算各主成分的贡献率和累计贡献率。
?
2?
?
0,求X的主成分?
5?
?
?
2?
T3.假设总体X?
(X1,X2,X3)的协方差矩阵为?
?
0?
?
?
?
2Y1,Y2,Y3,并计算各主成分的贡献率和累计贡献率,确定应取几个主成分。
4.设X?
(X1,X2,?
Xp)的协方差矩阵为 T?
?
11?
?
22?
?
?
?
?
?
?
0的特征值。
00?
pp?
?
?
,其中?
?
?
?
...?
?
1122?
?
?
?
pp,试求X的主成分及主成分具有 三.简答题 1.试述主成分分析的基本思想及求解步骤。
2.简述主成分分析中累积贡献率的具体意义。
第七章因子分析 一.判断题 1.因子载荷矩阵经过旋转后,每个公因子对原始变量的贡献度gi2不变。
2.因子分析模型中公共因子Fi是互不相关、不可测的变量,并且Var(Fi)?
1。
3.因子分析一般从变量的相关系数阵出发求因子模型。
4.因子载荷矩阵经过旋转后,变量Xi的共同度hi2不变。
5.因子分析模型中特殊因子与公共因子是不相关的。
6.因子分析与主成分分析都是一种降维,简化数据的方法,都是通过把原变量转化为新变量的线性组合达到降维的目的。
7.主成分分析中,主成分是不唯一的,但在因子分析中,因子模型是唯一的。
二.计算题 ?
1?
1.设标准化变量X1,X2,X3的协差阵为R?
?
?
?
R的特征值和相应的单位正交化的特征向量分别为:
?
?
?
1?
?
?
1?
?
2?
?
3?
?
(,,),l2?
(?
,),l3?
(,?
?
), 要求:
1)计算因子载荷矩阵A,并建立因子模型; 2)计算变量X3的共同度h3和公因子F2的方差贡献g2,并说明其各自的统计意义。
2.为研究某一片树叶的叶片形态,选取50片叶测量其长度x1(mm)和宽度x2(mm),按样本数据求得其平均值和协差阵为x1?
134,x2?
92,S?
?
?
90?
4848?
?
,求相关系数矩阵R,并R45?
22出发进行因子分析。
三.简答题 1.简述因子模型X?
AY?
?
中载荷矩阵A的统计意义。
2.因子分析与主成分分析的区别与联系因子分析从变量的相关性出发,根据相关性的大小将变量进行分组,同组变量的相 关性较强,不同组变量的相关性较弱,每组代表一个结构,这个结构用一个公因子表示,将变量表示成公因子的线性组合和特殊因子的和。
主成分分析是从空间生成的角度寻找能解释诸多变量变异绝大部分的几组彼此不相关的新变量。
因子分析是把变量表示成公因子的线性组合和特殊因子的和,主成分分析是把主成分表示成各变量的线性组合。
抽取因子的方法不仅有主成分法,还有主轴因子法,极大似然估计法等,主成分分 析只有主成分法抽取主成分。
主成分分析中当给定的协差阵或相关系数阵的特征值唯一时,主成分一般是固定 的,而因子分析中的因子不是固定的,可以旋转得到不同的因子。
四.下表是以学生六门考试成绩为变量,从相关系数阵出发,以主成分法抽取因子,进行因子分析的部分结果,根据表格回答下列问题:
表1TotalVarianceExplained Component123456 表2ComponentMatrix(a) 表3RotatedComponentMatrix(a) Componentmathphyschemliterathistoryenglish1-.806-.674-.675.893.825.8362.353.531.513.306.435.425Total.457.323.199.153InitialEigenvalues%ofVariance Cumulative% mathphyschemliterathistoryenglishComponent1-.387-.172-.184.879.911.9132.790.841.827-.343-.201-.216 5. 写出变量X1,X2的相关系数阵R的特征根及X1,X2,?
X6的方差和;假设用Yi表示主成分,写出前二个主成分的表达式及Y1的贡献率和前两个主成分的 累计贡献率并说明累计贡献率的统计意义; 写出旋转后的因子载荷矩阵A及因子模型; 求变量math的共同度h1及因子F2的方差贡献g2,并解释h1,g2的统计意义;对因子F1,F2进行合理的命名和解释。
2222第八章相应分析 一.判断题 1.相应分析中,行惯量与列惯量相同。
2.对变量进行相应分析时,应首先检验变量之间的独立性,只有当变量不独立时,进行相应分析才有意义。
3.相应分析实际是对两组高维空间的点的二维投影进行分析,并且相应分析主要是建立在图形分析的基础上,因此,相应分析的结果带有一定的主观性。
二.计算题 1.假定有两个因素A,B,每个因素各有两个水平,随机考察100个样品,得到一个二维的列 联表如下,求:
频率矩阵F; 因素A的第一个水平的分布轮廓;因素A两个水平之间的?
2距离; 检验因素A,B是否独立。
因素A2因素BB1B2第九章典型相关分 A15020析 一.判断题 1020A21.典型相关分析是研究多组变量之间相关关系的一种 多元统计方法。
2.典型相关分析是识别并量化两组变量之间的关系,将两组变量的相关关系的研究转化为一组变量的线性组合与另一组变量的线性组合之间的相关关系的研究。
3.若U?
a?
X,V?
b?
Y是两组变量X,Y的第一对典型相关变量,则U,V是X,Y的所有线性组合对中相关系数最大的一对。
4.进行典型相关分析时,若变量的量纲不同时,需要对变量进行标准化或从相关阵出发求典型相关变量;而若变量的单位相同时,则不需要对数据进行标准化,直接分析即可。
5.若Uk,Vk,k?
1,2,?
r是变量X,Y的典型相关变量,则 D(Uk)?
1,D(Vk)?
1,k?
1,2,?
r,并且Cov(Ui,Uj)?
Cov(Vi,Vj)?
0,i?
j 6.若Uk,Vk,k?
1,2,?
r是变量X,Y的典型相关变量,?
11,?
22分别是变量X,Y的方差阵,?
12是变量X,Y的协方差阵,?
i,i?
1,2,?
r是矩阵?
11?
12?
22?
21的特征根,则Cov(Ui,Vj)?
?
i?
0,i?
j,i?
1,2,?
(Ui,Vj)?
0,i?
j或j?
r。
其中r为矩阵?
11?
12?
22?
21的秩。
若?
1?
?
2?
?
?
?
r,则第一典型相关系数为?
1。
若?
1?
?
2?
?
?
?
r,a应于?
1的特征向量,则a22222222?
1?
12?
1?
1
(1),b
(1)
(1)分别为矩阵?
11?
12?
22?
21,?
22?
21?
11?
12相
(2)?
1?
1?
1?
1
(1)?
X
(1),b?
X即为第一对典型相关变量。
7.典型相关分析中,分别求出两组变量的第一主成分,两个第一主成分即构成第一对典型相关变量。
8.利用样本对两组变量X
(1),X
(2)进行典型相关分析时,即使X
(1),X
(2)互不相关,也有可 能得到的典型相关变量的协差阵不为零,因而利用样本数据进行典型相关分析时要对原始变量的协差阵是否为零进行检验。
9.典型载荷分析是了解每组变量提取的典型变量解释的该组样本总方差的比例,从而定量的测度典型变量所包含的原始信息量的大小;典型冗余分析是指原始变量与典型变量之间的相关性分析。
10.对变量进行相应分析时,应首先检验变量之间的独立性,只有当变量不独立时,进行相应分析才有意义。
二.以下是对一对二维变量的典型相关分析的结果,请根据结果回答下列问题。
表1CanonicalCorrelations12 表2Testthatremainingcorrelationsarezero Wilk’sChi-SQ DF Sig.1 .378 .0002 .997 .062 .803 表3RawCanonicalCoefficientsforSet-1 表4RawCanonicalCoefficientsforSet-2 1 2x1 -.057 -.140x2 -.071 .187 表5CanonicalLoadingsforSet-1 表6ProportionofVarianceofSet-1 ExplainedbyItsOwnCan.Var. x1x2 1-.935-.927 2-.354.375 CV1-1CV1-2 Prop.867.133 Var y1y2 1-.051-.080 2-.174.262 .788.054 写出两对典型相关变量的相关系数; 应该选几对典型相关变量,为什么?
并写出典型相关变量;x1与其典型相关变量的相关系数是多少?
第一组变量被自身的典型变量解释的方差比例是多少?
三.简答题 1.针对典型相关分析而言,简述典型变量与典型相关系数的概念。
2.简述典型相关分析中典型载荷分析及典型冗余分析的内容与作用。
第十章多维标度法 一.判断题 1.古典多维标度法中,若距离矩阵D为欧几里得矩阵,则D的构图唯一。
2.所有的距离矩阵都是欧几里得矩阵。
3.多维标度分析中,若内积距离阵B的特征根全部大于零,则距离阵D为欧几里得矩阵。
二.计算题 ?
0?
?
?
1.假设距离矩阵D?
?
?
?
?
?
10310102323103?
?
?
?
?
,求D的拟合构图。
?
?
?
?
?
0?
?
2.给定距离阵D?
?
?
?
?
?
10210221012210?
?
?
?
,求它的拟合构造点,并说明它是否是欧式型的。
?
?
?
?
三.简答题 1.简述古典多维标度分析的思想。
2.论述古典多维标度法的求解步骤。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计 期末 复习题