spss复习整理共14页.docx
- 文档编号:12765396
- 上传时间:2023-04-22
- 格式:DOCX
- 页数:23
- 大小:2.74MB
spss复习整理共14页.docx
《spss复习整理共14页.docx》由会员分享,可在线阅读,更多相关《spss复习整理共14页.docx(23页珍藏版)》请在冰豆网上搜索。
spss复习整理共14页
一、单项选择题:
(本大题小题,1分/每小题,共分)
1.SPSS的数据文件后缀名是:
(A).sav
2.对数据的各种统计(tǒngjì)处理,SPSS是在下面哪一个(yīɡè)选项中进行:
(A)数据(shùjù)编辑窗口;
3.在SPSS中,下面(xiàmian)哪一个不是SPSS的运行方式
(A)输入运行方式;
4.下面哪一个选项不属于SPSS的数据分析步骤:
(D)数据扩展;
5.在SPSS中,下面哪一个选项不属于对变量(列)的描述:
(B)变量名称大小;
6.在SPSS的定义中,下面哪一个变量名的定义是错误的:
(D)A_BFG_;首字符应以英文字母开头,后面可以跟除了!
、?
、*之外的字母或数字。
下划线、圆点不能为变量名的最后一个字符。
SPSS允许用汉字作为变量名。
7.在SPSS的定义中,下面哪一个变量名的定义是错误的:
(A)AND;SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等。
变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL、BY、AND、NOT、OR等。
8.在SPSS数据文件中,下面那一项不属于数据的结构:
(D)数据值;
9.在SPSS数据文件中,下面那一项属于数据的内容:
(D)数据值;
10.通常来说,发放了900份问卷,可直接得到的有效问卷有800份,则SPSS所建立的相关数据文件中的行数为
(D)800;
11.下面那一项不属于SPSS的基本变量类型:
(D)整数型;
12.当在SPSS数据文件中输入变量为“职工姓名”,则应选择的变量类型是:
(B)字符串型;
13.当在SPSS数据文件中输入变量为“职工工资数”,则应选择的变量类型是:
(A)数值型;
13.当在SPSS数据文件中输入变量为“公司成立日期”,则应选择的变量类型是:
(C)日期型;
14.在SPSS的数据结构中,下面那一项不是“缺失数据”的定义:
(D)数据不是科学计数法;
15.统计学依据变量的计量尺度将变量分为三类,以下哪一类不属于这三类:
(D)科学计数类型;
16.在统计学中,变量“身高”属于计量尺度中的:
(A)数值型变量;身高(定距)、优良中差(定序)、性别(定类)
17.在统计学中,将变量“年龄”分为“老年”、“中年”、“青年”三个取值,分别用1、2、3表示,则变量“年龄”属于计量尺度中的:
(B)定序型变量;
18.在统计学中,将变量(biànliàng)“性别(xìngbié)”分为(fēnwéi)“男”、“女”、两个(liǎnɡɡè)取值,分别用1、2表示,则变量“性别”属于计量尺度中的:
(C)定类型变量;
19.下面哪一个选项不能被SPSS系统正常打开:
(C)文本文件格式;
20.下面哪一个选项不能被SPSS系统正常打开:
(D).exe;
21.在SPSS数据编辑窗口中,需要定义变量的数据结构,以下哪一项不属于变量的数据结构:
(D)变量值;
22.在SPSS数据结构中,下面哪一项不属于数据类型:
(D)数值标签型;
23.下面哪一个选项不是SPSS中定义的基本描述统计量:
(D)回归函数;
24.下面哪一个选项不是SPSS中定义的基本描述统计量:
D)因子;
25.下面那一项刻画了随机变量分布形态的对称性:
(D)偏度系数;
26.下面那一项刻画了随机变量分布形态陡缓程度:
(D)峰度系数;
27.对于SPSS来说,下面那一项不包括在变量的频数分布内容中:
(D)均值;(频数、百分比、有效百分比、累计百分比)
27.对于SPSS来说,下面那一项不包括在变量的频数分布内容中:
(C)标准差;
28.在SPSS中,下面那一项不是频数分析中常用的统计图形:
(D)分类图;
29.在SPSS中,当需要对变量进行频数分析时,需要选择下面那一项菜单:
(C)分析;
30.在进行数据的统计分析之前,一般需要完成数据的预处理,以下哪一项不属于数据的预处理内容:
(B)峰度和偏度处理;
31.在SPSS中,当我需要对原有某个变量的数据进行取对数运算时,应选取下面那一项进行处理:
(A)变量计算;
32.在SPSS中,下面那一项不属于数据分组的目的:
(D)有利于进行因子分析;
33.对于SPSS中的组距分组,下面那一项是正确的说法:
(A)分组数与数据本身特点和数据个数有关;
34.对于SPSS来说,能够快捷找到变量数据的最大值和最小值的数据预处理方法是:
(A)排序;
35.对于SPSS来说,能够快捷找到变量数据的异常值的数据预处理方法是:
(A)排序;
36.在学生的一张数据表中,有平时(píngshí)分数、实验分数和卷面分数,如使用SPSS计算(jìsuàn)最终得分,则需要使用SPSS预处理中的:
(C)变量(biànliàng)计算;
37.在SPSS中,以下哪个选项可以完成如下功能:
由收集的整体数据中抽取(chōuqǔ)出年龄大于30的数据:
(A)数据选取;
38.下面哪一个选项不是对数据的基本统计分析:
(D)实现变量的排序与合并;
39.在SPSS中,当变量是数值型时,则频数分析所用图形为:
(A)直方图;
40.在SPSS中,当需要选取出满足某一个条件的所有个案,则使用下面的那一项:
(A)个案选择;
41.在SPSS中,均值的计算适合下面那一项:
(A)定距型;
42.现有一批数据为(0,1,2,-2,3,-3,4),则这批数据的极差为:
(A)7;
43.以下图是某随机变量的概率密度,请问其峰度是:
(B)小于零;右偏大于0;左偏小于0;偏度为0表示对称。
44.以下图是某随机变量的概率密度,请问其峰度是:
(A)大于零;
45.以下图是某随机变量的概率密度,请问其峰度是:
(C)等于零;
46.单因素方差分析的第一步是明确观测变量和控制变量,例如,当分析不同施肥量是否对农产品产量带来显著影响、地域差别是否对妇女生育率有关系和学历对工资的作用关系时,控制变量分别是:
(A)施肥量、地域和学历;(B)施肥量、生育率和学历;
(C)施肥量、地域和工资;(D)农产品产量、地域和学历;
47.单因素方差分析的第一步是明确观测变量和控制变量,例如,当分析不同施肥量是否对农产品产量带来显著影响、地域差别是否对妇女生育率有关系和学历对工资的作用关系时,观测变量分别是:
(A)农产品产量(chǎnliàng)、妇女(fùnǚ)生育率和工资(gōngzī);
48.当需要分析多个随机变量(suíjībiànliànɡ)之间的相互影响和关系时,在SPSS中应使用下面哪一个选项:
(D)交叉分组下的频数分析;
49.下面那一种情况下,可以使用交叉列联表中来进行卡方分布检验:
(A)列联表单元格的全部期望频数都大于6;
50.当需要分析某一个变量的分布情况时,采用下面那一个选项较为合适:
(A)频数分析;
51.在统计分析中,描述变量的数据离散程度的基本统计量是:
(A)标准差;
52.在统计分析中,描述变量数据分布的中心位置的基本统计量是:
(D)均值;
53.在统计分析中,描述变量数据分布的对称程度的基本统计量是:
(B)偏度;
54.在统计分析中,描述变量的数据分布的陡峭程度的基本统计量是:
(C)峰度;
55.下面那一种说法是正确的:
(B)偏度大于零,则数据分布的长尾巴在左边;
56.下图中右下角的问号应选择:
(C)参数检验;
57.在得到一批未知其总体分布的数据后,可使用以下哪种方法验证其是否与某个已知理论分布相吻合:
(C)参数检验;
58.需要检验一批未知的连续数值型随机单样本是否是正态分布,则需要下面的那一项:
(C)标准差检验;
59.已知某一分布是正态分布的随机变量
的均值为
,方差为
,则将其转换成标准正态分布(即均值为0,标准差为1)的公式是:
(A)
;(B)
;(C)
;(D)
;
60.下面那一项不是两独立样本t检验的前提条件:
(D)两个样本的方差必须相等;
61.设待检验(jiǎnyàn)两个总体的均值分别为
、
,则相关(xiāngguān)的两独立(dúlì)样本t检验的假设
是:
(A)
;
62.在交叉列联表检验中,行数为6,列数为7,则当变量(biànliàng)间独立时所对应卡方分布的自由度是:
自由度=(列数-1)*(行数-1)
(A)30;
63.在交叉列联表检验中,当变量间独立时所对应检验统计量的分布是:
(A)卡方分布;
64.已知两批独立随机样本都服从正态分布,要检验这两批随机样本的方差是否相同,则需要采用:
(A)F检验;
65..已知两批独立随机样本都服从正态分布,要检验这两批随机样本的均值是否相同,则需要采用:
(B)两独立样本t检验;
66.已知一批独立随机样本服从正态分布,要检验这批随机样本的均值是否与某总体分布的均值相同,则需要采用:
(A)单样本t检验;
67.下面那一项不属于假设检验的基本步骤:
(B)画出随机样本的直方图;
68.当样本的分布未知,需要利用样本的数据推断出总体分布形态的方法是:
(A)非参数检验;(B)参数检验;(C)方差检验;(D)因子分解;
69.在总体分布未知的情况下,利用样本数据对所假定总体的分布进行显著性检验的方法是:
(B)非参数检验;
70.现有两段独立样本数据,欲判断它们之间的分布是否存在显著性差异,则可采用:
(B)非参数检验;
71.单样本的总体分布卡方检验属于:
(C)非参数检验,用于了解样本的分布是否与某一已知的理论分布吻合;
72.单样本K-S检验属于:
(C)非参数检验,用于了解连续数值型样本的分布是否与某一已知的理论分布吻合;
73.两配对样本t检验的目的是:
(C)推导出来自于两个总体的配对样本的分布是否存在显著性差异;
74.以下是使用SPSS所做的非参数检验的结果图,根据所给图选择正确的一项:
:
(A)接受(jiēshòu)假设H0;
75.样本(yàngběn)值序列为1011011010011000101010000111,则整段样本值序列的游程数是:
(A)17;
75.样本(yàngběn)值序列为男男女女(nánnánnǚnǚ)女男女女男男男男,则整段样本值序列的游程数是:
(A)5;
76.样本值序列为男男男男男男男女女女女女,则整段样本值序列的游程数是:
(A)2;
77.样本值序列为男男男男男男男女女女女女,则整段样本值序列的游程数是:
(A)2;
78.样本值序列为男女男女男女男女男女男男,则整段样本值序列的游程数是:
(C)11;
79.样本值序列为00110111000100100010,则整段样本值序列的游程数是:
(C)11;
80.样本性质下面的那一项可适用于两独立样本的曼-惠特尼U检验:
(A)样本秩;
81.样本性质下面的那一项可适用于两独立样本的K-S检验:
(B)样本数值;
82.下图是某两独立样本的游程检验示意图,请问图中数据的游程数是:
(A)6;
83.K-S检验可用于:
(B)非参数检验;
84.下面那一选项是独立样本:
(A)分别(fēnbié)对两批不同年级的大学生调查他们的学习兴趣;
85.现有(xiànyǒu)一批数据:
2.3,1.2,3.8,6,9,则6的秩是:
(C)4,
86.观察某新开发的饲料对猪的影响:
首先不用这个饲料,测量猪在一个月的体重;再在下一个月内使用新饲料喂养同一批猪,测量体重;实验者想知道前后两个月猪的体重的分布是否(shìfǒu)有差别,则可用以下哪一项进行检验:
(C)方差(fānɡchà)检验;
87.观察某新的营销手段对商品销售量的影响:
首先不用这个营销手段,测量10种商品在一个月的销售量;再在下一个月内使用该新营销手段处理同样这10种商品,测量销售量;实验者想知道这新的营销手段是否对商品的销售量有显著性区别,则可用以下哪一项进行检验(销售量的分布未知):
(A)非参数检验中的两配对样本检验;
88.观察性别是否对书籍种类的购买意愿有差别:
随机选择20个男同学,随机选择30个女同学,分别调查他们对书籍的购买意愿,调查者想知道性别对数据种类的购买是否有影响,则可使用(男和女同学购买数据的分布是正态分布):
(B)非参数检验中的两独立样本检验;
89.在假设检验中,秩的概念主要用在下面那一项中:
(B)非参数检验;
90.现有一种饲料,使用不同的数量来喂养动物,测量出不同喂养量情况下动物的体重,现欲知道动物的体重是否与不同喂养量有关,则采用下面那一项:
(D)方差检验;
91.使用某种肥料对10块玉米田的产量进行实验,分别在每块田内使用0公斤、1公斤、2公斤、3公斤、4公斤、5公斤该肥料,再测量出每种肥料使用量和每块田的产量,当使用方差分析时,下面哪一个说法是正确的:
(A)肥料量是控制变量,每块田的产量是观测变量;
92.在制定某商品广告宣传策略时,广告效果可能会受到广告形式、地区规模、选择的栏目、播放的时间段、播放的频率等因素的影响。
人们需要研究在影响广告效果的众多因素中,那些因素是主要的,则最适合的分析方法是:
(C)多配对样本分析;
93.在方差分析中,共分为4组,每组有30个数据,则检验统计量F服从:
(A)自由度为(3,116)的F分布;F(k-1,n-k)
94.现有一批数据:
3.2,1.3,4.5,6,0.8,9.8,1.2,则1.2的秩是:
(A)2;
95.现有一批数据:
3.2,1.3,4.5,6,0.8,9.8,1.2,则1.3的秩是:
(B)3;
96.现有一批数据:
3.2,1.3,4.5,6,0.8,9.8,1.2,则3.2的秩是:
(D)4;
97.现有一批数据:
3.2,1.3,4.5,6,0.8,9.8,1.2,则4.5的秩是:
(B)5;
98.现有一批数据:
3.2,1.3,4.5,6,0.8,9.8,1.2,则6的秩是:
(A)6;
99.现有一批数据:
3.2,1.3,4.5,6,0.8,9.8,1.2,则9.8的秩是:
(D)7;
100.现有(xiànyǒu)一批数据:
3.2,1.3,4.5,6,0.8,9.8,1.2,则0.8的秩是:
(C)1;
101.比较多种促销形式对同样10种商品销售的影响,则需要以下(yǐxià)方法:
(C)多配对(pèiduì)样本的非参数检验;
102.分析(fēnxī)不同广告形式、不同地区对产品的销售额影响时,需要使用:
(B)多因素方差分析;
103.在多因素方差分析中,下面那一项不会影响观测变量的变动:
(A)各控制变量的独立作用;
104.变量x=(1,2,3),y=(2,4,6),则变量x和y的相关系数是:
(A)1;
105.对于变量x和y之间的相关系数,下面哪一个说法是错误的:
(D)当变量之间存在非线性关系时,还可以使用相关系数判断x和y之间的关系;
106.对于回归分析来说,下面那一项不属于回归分析的基本步骤:
(C)计算样本数据的峰度;
三、简答题:
(请将解答写在试卷上,本大题3小题,10分/每小题,共30分)
1.如下是一份问卷调查表:
①被调查者专业:
(A)理科;(B)文科;(C)工科;(D)社会科学;
②被调查者年级:
(A)1年级;(B)2年级;(C)3年级;(D)4年级;
③被调查者性别:
(A)男;(B)女
④被调查者年级的月花费量;
⑤被调查者入学日期;
⑥被调查者民族;
请按照SPSS中的要求,分别填写下表中的变量结构:
名称
类型
度量标准
专业
字符串型
定类型变量
年级
字符串型
定序型变量
性别
字符串型
定类型变量
月花费量
数值型
数值型变量
入学日期
日期型
定序型变量
民族
字符串型
定类型变量
注:
类型有“数值型”、“字符串型”、“日期型”;度量标准有“数值型变量”、“定序型变量”、“定类型变量”。
2.现有计数数据如下:
血压
低血压
(1)
正常
(2)
高血压(3)
年龄
30岁以下(用1表示)
27
48
23
30-49岁(用2表示)
37
91
51
50岁以上(用3表示)
31
93
73
请按照SPSS中的要求(yāoqiú),分别填写下表中的变量结构:
名称
类型
度量标准
年龄
数值型
定序型变量
血压
数值型
数值型变量
3.现有计数(jìshù)数据如下:
血压
低血压
(1)
正常
(2)
高血压(3)
年龄
30岁以下(用1表示)
27
48
23
30-49岁(用2表示)
37
91
51
50岁以上(用3表示)
31
93
73
请按照(ànzhào)SPSS中的要求,分别填写下表中的数据组织方式(fāngshì):
变量1
变量2
变量3
年龄
血压
合计
1
1
27
1
2
48
1
3
23
2
1
37
2
2
91
2
3
51
3
1
31
3
2
93
3
3
73
注:
需填写“变量1”、“变量2”、“变量3”的具体名字。
4.现在SPSS中某一变量的一批数据如下:
-1.16;1.43;-0.87;-0.45;-1.79;-1.52;1.01;0.74;0.58;0.01;-0.88;1.52;-0.27;-0.01;1.36;-0.21;
请计算这批数据的均值,方差,标准差:
全距,偏度系数,峰度系数
解:
均值=-0.03
方差=1.10
标准差=1.05
全距=1.52-(-1.79)=3.31
偏度系数=0.01
峰度系数=-1.19
5.年龄和血压列联表如下:
血压
低血压
正常
高血压
年龄
30岁以下计数
27
48
23
98
30-49计数
37
91
51
179
50岁以上计数
31
93
73
197
合计
计数
95
232
147
474
请根据交叉列联表的卡方检验(jiǎnyàn)步骤,判断年龄和血压之间是否是独立无关的。
答:
经过(jīngguò)血压(xuèyā)和年龄的交叉(jiāochā)列联表的卡方检验,得出渐进Sig.(双侧)的值大于0.05,因此年龄和血压之间不独立。
6.请简述单样本t检验的目的、前提和实现步骤。
答:
目的:
利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值存在显著差异,它是对总体均值的假设检验。
检验前提是样本来自的总体应服从或近似服从正态分布。
实现步骤:
提出原假设—选择检验统计量—计算检验统计量的观测值和概率P-值—给定显著水平a,并作出决策。
7.请简述两独立样本t检验的目的、前提和实现步骤。
。
答:
目的:
利用来自两个总体的独立样本,推断两个总体的均值是否存在显著差异。
检验前提是:
样本来自的总体应服从或近似服从正态分布;两样本相互独立,即从一总体抽取一个样本对另一总体中抽取一个样本没有任何影响,两个样本的量可以不相等。
实现步骤:
提出原假设—选择检验统计量—计算检验统计量的观测值和概率P-值—给定显著水平a,并作出决策。
8.请简述假设检验的步骤。
答:
提出原假设和备择假设—选择检验统计量—计算检验统计量观测值发生的概率—给定显著水平a,并作出决策。
9.下面是某一个参数检验的结果:
问题如下:
(1)这是单样本t检验还是两独立样本t检验?
两独立样本t检验
(2)请简述F检验的结果;经查看,该检验的F统计量的观测值为0.161,对应概率P-值为0.688,由于概率P-值大于0.05,因此两总体的方差没有显著差异。
(3)请简述检验的结果。
两总体均值检验,其中t的观测值为-0.34,对应的双侧概率0.734,由于概率值大于0.05,因此两总体的均值没有显著差异
10.下面是一张有关两种工艺下产品寿命的SPSS表,其中sysm表示使用寿命值,gy表示两组
请用两独立(dúlì)样本的曼-惠特尼方法对这批数据进行检验,判断两组数据的分布是否存在显著性差别(只需要(xūyào)给出曼-惠特尼U统计量的值即可)。
答:
U=W-k(k+1)/2=40-8*9/2=4
11.下图左边(zuǒbian)是SPSS中甲乙两种工艺下某产品寿命(shòumìng)的一批数据,请在下图右表中计算出混合排序后的样本数据,各组标记、甲乙工艺的累积频数、累积频率和累积频率的差。
(提示:
两独立样本的K-S检验)。
经过计算,混合排序后的样本数据分别为646、649、650、651、652、661、662、663、669、672、675、679、682、692、693,各组标记分别为2、2、2、2、2、1、2、2、1、2、1、1、1、1、1,甲工艺累计频数为0、0、0、0、0、1、1、1、2、2、3、4、5、6、7,乙工艺的累计频数为1、2、3、4、5、5、6、7、7、8、8、8、8、8、8,甲工艺累计频率为0、0、0、0、0、0.143、0.143、0.143、0.286、0.286、0.429、0.571、0.714、0.857、1,乙工艺累计频率为0.125、0.25、0.375、0.5、0.625、0.625、0.75、0.875、0.875、1、1、1、1、1、1,累计频率差为0.125、0.25、0.375、0.5、0.625、0.625、0.482、0.607、0.732、0.589、0.714、0.571、0.429、0.286、0.143。
四、叙述(xùshù)和分析题:
(本大题小题,分/每小题,共分)
1.请简述(jiǎnshù)利用(lìyòng)SPSS进行数据分析的步骤。
SPSS数据(shùjù)的准备—SPSS数据的加工整理—SPSS数据的分析—SPSS分析结果的阅读和理解。
2.现有SPSS数据如下图:
请完成以下任务:
①画出该SPSS数据的交叉列联表;
②请进行所做交叉列联表的卡方检验;
③判断年龄和血压之间是否有关系。
(1)
血压
低血压
(1)
正常
(2)
高血压(3)
年龄
1
27
48
23
2
37
91
51
3
31
93
73
(2)假设行变量和列变量独立,计算卡方统计量值为9.352a,并得出统计量观测值得概率为0.53,大于0.05,因此在原假设的前提下,卡方观测值出现时极有可能的,因此假设成立。
(3)年龄和血压之间相互独立。
3.如下图为四个城市的儿童身高调查表:
使用非参数检验(jiǎnyàn)中的多独立样本的Kruskal
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 复习 整理 14