营销数据分析总复习.docx
- 文档编号:26044117
- 上传时间:2023-06-17
- 格式:DOCX
- 页数:69
- 大小:439.08KB
营销数据分析总复习.docx
《营销数据分析总复习.docx》由会员分享,可在线阅读,更多相关《营销数据分析总复习.docx(69页珍藏版)》请在冰豆网上搜索。
营销数据分析总复习
营销数据分析总复习题
第一部分章节复习题
第一、二章
一、单项选择题
1.问卷设计中封闭式间题与开放式问题的区别是
A.列出两个对立的答案,由被调查者选择一个
B.列出多个备选答案,由被调查者选择一个
C.列出多个备选答案,被调查者选择多个
D.前者设立备选答案,后者不设备选答案
2.在给变量命名时,下面的提法正确的是:
A.SPSS的变量名中不能有汉字
B.SPSS的变量名中可以有汉字,最多可以有8个汉字
C.SPSS的变量名中可以有汉字,最多可以有4个汉字
D.SPSS的变量名中可以有汉字,汉字个数没有限制
3.SPSS数据文件的扩展名是:
A..xlsB..sas
C..doc
D..sav
4.对于用SPSS读取Excel的数据文件,下面的提法正确的是:
A.SPSS不能读取Excel的数据文件
B.如果Excel的数据文件首行有变量名,那么
名
SPSS只能读取数据而无法读取首行的变量
C.如果Excel的数据文件首行有变量名,那么SPSS不仅可以读取数据,而且可以读取首
行的变量名
D.以上说法都不对
5.横向合并数据选择怎样的菜单
A.MergerFileB.AddCases
C.MergeVariableD.AddVariable
二、多选题
1.下列名称哪些可以在SPSS中充当变量名。
A.性别B.XINGZHENGSHIYED
E.A!
358F.J5678
C.行政事业单位G.N_35678
D.NIANNIN
H.ALL
2.SPSS有哪些数据类型。
A.数值型B.定序型
E.定量型F.日期型
C.定类型
G.标准型
D.字符型
H.圆点型
三、简答题
1.按数据的计量尺度可将数据分为哪三类,这三类数据类型在SPSS中如何定义其尺度。
并分别举例说明。
2、下面是每周去图书馆学习的次数的编码方案:
1=每天去1次
2=每周去2次或2次以上
3=每周去3次或3次以上
4=每周去4次或4次以上
1)如此编码,有无错误?
为什么?
2)试写出正确的编码方案。
3、下图是对年龄、职业、喜欢的颜色三个变量的编码方案及其栏目位置。
Variable
Code
栏目位置
Age
80岁是MissingValue
1~2
Occupation
1)职业不编码2)职业变量用全称
10~14
Color
颜色用第1个字母作为变量值
10
该编码有什么问题?
请加以更正。
4.1)在下窗口左框UnpairedVariables中*代表什么?
+代表什么?
2)Indicatecasesourceasvariable项代表什么?
3)上窗口能对数据文件进行怎样的处理?
5、变量的横向合并中,如目标数据文件“F1.sav”有30个Cases,每个Cases各有50个变量,即v1,v2,v3,⋯v50。
目标数据文件“F2.sav”有30个Cases,每个Cases各有30个变量,
即x1,x2,x3,⋯x30。
则合并后的大目标数据文件“F12.sav”中有多少个Cases,每个Cases各有多少个变量?
6、Cases的纵向合并中,如目标文件“F3.sav”有20个Cases,每个Cases有50个变量,
即v1,v2,v3,⋯v50。
目标数据文件“F4.sav”有30个Cases,每个Cases各有50个变量,即
v1,v2,v3,⋯v50。
则合并后的大目标文件“F34.sav”中有多少个Cases,每个Cases各有多少个变量?
第三章
SPSS数据的预处理
一、单项选择
1.数值5.6789E-02等于:
A.5.6789
B.0.056789
C.0.0056789
D.567.89
2ab
2.将数学式子:
写成SPSS的算术表达式,正确的是:
x
y
A.2*a*b/x+y
B.2*a*b/(x+y)
C.2ab/x+y
D.2ab/(x+y)
3.在SPSS中,用逻辑表达式来表示“年龄在
40以上(含40)而且在50以下(不含
50)”,
正确的是:
A.40<=年龄<50
C.年龄>=40且年龄
<50
B.年龄
D.年龄
>=40&>=40|
年龄<50
年龄<50
二、简答题
1、实发工资等于基本工资加上补贴减去住房公积金,然后再依据职称将以上计算结果进行
调整,以中级为基本单位,初级下调10%,副高上调10%,正高上调20%,请写出各职称的工资发放表达式。
2、下窗口中,includeallcases和includeifcasesatisfiescondition分别代表什么。
如果文化程度编码为1初中2高中3大专4本科,现只需对本科学历的人群进行分析,
如何
填写箭头旁的方框。
3、数据的选取方法有几种?
下列情况应采用怎样的数据选取方式?
1)希望选取全部样本的前
5个cases。
2)希望对全部样本的30%的数据进行分析
3)假定职业有三种,工人、教师、医生。
希望选取工人样本。
4)希望选取全部样本中
50~100个cases进行分析。
5)希望选取在所有变量上都没有缺省值的
cases。
4、在对基本工资的分析中,可以通过分类汇总分析不同性别人群的基本工资。
如果我们还
想了解不同性别不同职称人群的基本工资呢?
应如何进行分类汇总?
请直接计算和排序。
序号
性别(男1,女2)职称(高级
1,副高2,中级3,初级4)
基本工资
001
1.0
1.0
1014.0
002
1.0
2.0
984.0
003
1.0
1.0
1044.0
004
1.0
3.0
866.0
005
1.0
3.0
848.0
006
2.0
4.0
824.0
007
2.0
4.0
824.0
008
2.0
4.0
824.0
009
2.0
2.0
859.0
010
1.0
3.0
827.0
5、有100个数据,请按照
sturges提出的经验公式来确定组数。
又该100
个数据是年龄,最
大值为40岁,最小值为20岁,应该确定多少组数,且组距如何?
6、下表是某广告公司的不同广告类型投放价格和关注率,请计算广告的平均价格。
广告类型
单价(千元/人)
关注率
电视
50
30
广播
1.2
2
网络
3
25
报纸
6
10
户外
1.5
6
请说明在SPSS中应如何操作,并直接计算结果。
第四章SPSS基本统计分析
一、单项选择
右面的表是使用
SPSS,对20个人的英语成绩进行的基本统计分析的结果,
回答下面的问题:
1.均值等于:
A.81.80
B.82.50
C.79
D.68.905
2.标准差等于:
A.1.856
B.8.301
C.68.905
D.79.00
3.标准误等于:
A.1.856
B.8.301
C.68.905
D.79.00
4.四分位数间距等于:
A.79.00
B.82.50
C.88.00
D.9.00
5、比较下面7个变量,指出哪个变量适
合计算均值、众数或中位数?
1)location(地区)2)like1(爱好)3)height(身高)4)score(成绩)
5)vf(父亲职业)6)income(年收入)7)child(子女数)
6、对于频率表而言,以下的说法哪个为真?
哪个为假?
1)有效的百分数和累计的百分数,均为不包括缺省值。
2)累计百分数的总和为100%。
3)频次一栏根本不显示。
4)有效的百分数的总和为100%。
7※、下图为一张择偶标准的频率表,试对空缺的频次和百分比填补完整。
frequency
percent
Validpercent
Cumulative
percent
Valid相貌
15
38.5
38.5
38.5
文化水准
51.3
气质风度
7
17.9
17.9
志同道合
5
12.8
12.8
82.1
人品
3
7.7
7.7
89.7
本人收入
1
2.6
2.6
92.3
其他
3
7.7
100.0
Total
39
100.0
100.0
8、下列数据是20名学生已读过的杂志数(单位:
本)
2,2,2,3,3,3,3,4,4,4,4,5,5,5,6,6,6,9,9,10
1)描述这些数据时,用条形图还是直方图?
2)直方图与条形图的区别是什么?
9、某样本有儿童10人(编码为1),有少年
15人(编码为
2),有青年20人(编码为3)。
计算这三种人的各个统计量有无意义?
若有,请计算。
1)均值
2)众数
3)中位数
10、某样本有
355个个案,并且是有序的,即第
1个个案是最大值,第二个个案是次大值,
第355个个案是最小值,第几个个案为中位数?
11、在某公司,为数极少的老板工资年收入达
5位数,但绝大多数员工工资收入只有
3位数,
如果你是公司的经理,
你将用怎样的统计量来描述高支付水平,
为什么?
如果你是该公司员
工,你将用什么样的统计量来描述低支付水平?
为什么?
12※、下面是10个家庭分别拥有的车辆数,
0,1,1,1,2,2,2,2,2,4,根据这些数
据,填补下表中的空缺值。
mean
variance
Stddev
1.06
maximum
minimum
mode
median
range
13、在一次考试中,学生的成绩均值为
Mean=80,标准差为S=10。
请计算下表中的标准值
Z。
student
成绩
Standardscore(z)
1
75
2
85
380
14、某教师计算某次考试成绩的统计量如下:
Mean=60
range=60
N=99
minimum=30
maximum=90
后来,他发现还有一张卷子漏了统计,其分数为统计量。
60分。
试把这份卷子补上,重新计算这个
15、某研究人员探讨他所设计的实验教学是否能提升学生的数学成绩。
他将研究对象前后测
验成绩转成百分等级后,比较低、中、高三组学生成绩百分等级进步的情形,分析结果发现
中等程度的学生进步最多,低能力和高能力组的学生进步不多。
请你参考下表说明该研究分析与解释的问题。
数学成绩测验的原始分数、百分等级、和百分带
能力高低
原始分数
百分等级
X1E
X1E之百分带
高
61
94
57~65
84~99
中
48
38
44~52
27~50
低
35
14
31~39
8~22
注:
E将近4
16、已知某变量服从正态分布,其均值为0.09,标准差为0.12。
从这些数据中,您能否算出
以下统计量,为什么?
1)中位数2)众数3)方差4)峰态系数
17、某研究人员,对原始数据标准化后,获得标准值的均值为1.15。
该值是否意味着要对均
值重新检查?
为什么?
18、某样本,男编码为0,女编码为1,若平均性别为0.8。
这个平均值有意义吗?
含义是什么?
19、试判断下述的真假。
1)Range,不像方差分析那样受端点的影响特别大。
2)如果有个样本,其均值、中位数和众数三者近似于相同,那么此分布也趋于有近似的方差。
20.下列属于数据描述的指标或方法有
A.非参数检验
C.主成分分析
B.标准差
D.峰度
E.平均数
21.填补下表空缺。
V2*v3crosstabulation
count
V3
total
1
2
V2
1
60
2
80
total
50
90
140
22、crosstabs表格中,可以用什么检验来判断行列变量之间的关系,该检验原假设和统计量
是如何表达的?
23、下图是性别(
(学城市
生家
庭住
址)
农村
TOTAL
sex)和地区(location)的交叉汇总表。
(学生家庭住址)*(学生性别)crosstabulation
(学生性别)
TOTAL
男生
女生
count
12
12
24
%within(学生家庭住址)
50.0%
50.0%
100.0%
%within(学生性别)
80.0
85.7%
82.8%
%ofTotal
41.1%
41.4%
82.8%
count
3
2
5
%within(学生家庭住址)
60.0%
40.0%
100.0%
%within(学生性别)
20.0%
14.3%
17.2%
%ofTotal
10.3%
6.9%
17.2%
count
15
14
29
%within(学生家庭住址)
51.7%
48.3%
100.0%
%within(学生性别)
100%
100.0%
100.0%
%ofTotal
51.7%
48.3%
100.0%
1)如果性别与地区是互为独立的2个变量,每个单元的期望频次是多少?
2)这个交叉表的自由度为多少?
3)独立性卡方检验的卡方值为多少?
24、如果希望出现图1应在图2的SPSS选项中如何选择?
图1图2
25、请将下图翻译成中文,并说明结果。
26※、下图是一种什么样的输出表?
它与
frequencies过程产生的表格有什么区别?
Group$LIKE
业余爱好
Categorylabel
Code
Count
PctofResponses
PctofCases
听戏看电影
1
87
23.6
48.1
看小说读报
2
151
40.9
83.4
唱歌跳舞
3
41
11.1
22.7
交朋友
4
43
11.7
23.8
下棋打牌
5
47
12.7
26.0
TotalResponses
369
100.0
203.9
8missingcases;181validcases
27※、下图是一种什么样的交叉汇总表?
它与
crosstabs过程产生的交叉汇总表有什么区别?
28、上图是一个多重应答的交叉汇总表,请回答下列问题:
1)rowtotal值是如何计算的?
为什么?
2)columntotal值是如何计算的?
为什么?
3)试分析其频次分布。
29、请解释下表各项。
第五章参数检验
第六章SPSS方差分析
1、下表是身心障碍学生和一般学生在某语言测验得分均值差异检验的
SPSS报表,请你根据
表中资料说明检验结果。
GroupStatistics
组別
N
Mean
Std.Deviation
Std.ErrorMean
身心障碍
81
65.7901
13.00261
1.44473
一般
104
89.9135
6.77389
.66423
IndependentSamplesTest
Levene'sTestforEqualityofVariances
t-testforEqualityofMeans
F
Sig.
t
df
Sig.
Mean
(2-tailed)
Difference
Equalvariancesassumed
32.48
.000
-16.30
183
.000
-24.12
Equalvariancesnotassumed
-15.17
113.46
.000
-24.12
2、请问下列统计方法适合用来做哪些广告方面的研究?
请各举一例说明。
(一)pairedsamplet-test
(二)chi-squaretest
(三)correlation
3、以下几个问题,你打算采用frequencies,crosstabs或means之中的哪种过程解答?
1)城市考生和农村考生的平均成绩。
2)城市与农村两地考生的男生和女生人数。
3)每个地区的考生人数。
4)每个地区中男生和女生的高考平均成绩。
5)家在城市(或农村)的男女考生的年龄分布。
4、下述说法,哪一个真,哪一个假?
1)T检验的显著性水平是“总体均值相等的概率”
2)如果T检验的显著性水平较大,可以确信“均值相等”。
3)样本的规模,部分地影响“均值是否相同”的检验。
4)T检验小的显著性水平,导致T-value接近于0。
5)样本较大,样本均值的标准误差也较大。
6)配对样本T检验,比独立样本T检验,对均值的实际差别更敏感。
5、某研究员想通过均值来确定某工厂的硫磺在空气中的污染程度,是否高于法律所容许的标准,他该采用哪种T检验。
6、如果采用了配对T检验检测2个均值相等的假设,并获得P=0.001,这两个均值有可能相等吗?
7、1)一个独立样本T检验的零假设是什么?
2)一个配对样本T检验的零假设是什么?
8、两独立样本T检验的前提是什么?
用什么方法来检验两总体方差是相等的?
如出现了两
总体方差不相等的情况,还能进行两独立样本T检验吗?
9※、下表是男女家庭人均住房面积两独立样本T检验结果。
请说明。
GroupStatistics
性别NMeanStd.DeviationStd.ErrorMean
人均面积男189422.497912.81030.29435
女109921.158212.47087.37618
IndependentSamplesTest
Levene'sTestfor
EqualityofVariances
t-testforEqualityofMeans
95%ConfidenceInterval
Sig.
Mean
Std.Error
oftheDifference
F
Sig.
t
df
(2-tailed)
Difference
Difference
Lower
Upper
人均Equalvariances
.322
2.785
2991
.005
1.33965
.48108
.39638
2.28293
.981
面积assumed
Equalvariances
2.805
2.344E3
.005
1.33965
.47766
.40298
2.27633
notassumed
10※、下表是住房满意和未来三年是否买房的配对T检验,请解释下表。
PairedSamplesStatistics
MeanNStd.DeviationStd.ErrorMean
Pair1住房满意1.61282880.48718.00908
未来三年1.24972880.43289.00807
PairedSamplesCorrelations
NCorrelationSig.
Pair1住房满意&未来三年2880.200.000
PairedSamplesTest
PairedDifferences
Std.Std.Error95%ConfidenceIntervalSig.
MeanDeviationMeanoftheDifferencetdf(2-tailed)
LowerUpper
Pair1住房满意-未来三年.36319
.58346
.01087
.34188
.384513.341E13.E3
.000
11、某职业病防治院对15名石棉矿工中的石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,结果见下表,假定资料满足各种参数检验所要求的前提条件。
问三组石棉矿工的用力肺活量有无差别?
石棉肺患者
可疑患者
非患者
1.8
2.3
2.9
1.4
2.1
3.2
1.5
2.5
3.2
1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 营销 数据 分析 复习