《统计分析和SPSS的应用第五版》课后练习答案解析第4章Word文件下载.docx
- 文档编号:15804946
- 上传时间:2022-11-16
- 格式:DOCX
- 页数:12
- 大小:223.79KB
《统计分析和SPSS的应用第五版》课后练习答案解析第4章Word文件下载.docx
《《统计分析和SPSS的应用第五版》课后练习答案解析第4章Word文件下载.docx》由会员分享,可在线阅读,更多相关《《统计分析和SPSS的应用第五版》课后练习答案解析第4章Word文件下载.docx(12页珍藏版)》请在冰豆网上搜索。
70.9
边远郊区
82
29.1
100.0
Total
国家机关
24
8.5
商业服务业
54
19.1
27.7
文教卫生
18
6.4
34.0
公交建筑业
15
5.3
39.4
经营性公司
45.7
学校
51.1
一般农户
35
12.4
63.5
种粮棉专业户
4
1.4
64.9
种果菜专业户
10
3.5
68.4
工商运专业户
34
12.1
80.5
退役人员
17
6.0
86.5
金融机构
98.9
现役军人
3
1.1
20岁以下
20~35岁
146
51.8
53.2
35~50岁
91
32.3
85.5
50岁以上
41
14.5
分析:
本次调查的有效样本为282份。
常住地的分布状况是:
在中心城市的人最多,有200人,而在边远郊区只有82人;
职业的分布状况是:
在商业服务业的人最多,其次是一般农户和金融机构;
年龄方面:
在35-50岁的人最多。
由于变量中无缺失数据,因此频数分布表中的百分比相同。
2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。
进一步,对不同常住地储户存款金额的基本特征进行对比分析。
分析——描述统计——描述,选择存款金额到变量中。
点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续——确定。
由表中可以看出,有效样本为282份,存(取)款金额的均值是4738.09,标准差为10945.09,峰度系数为33.656,偏度系数为5.234。
与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;
由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。
由表中可以看出,中心城市有200人,边远郊区为82人。
两部分样本存取款金额均呈右偏尖峰分布,且边远郊区更明显。
3、利用第2章第7题数据,如果假设存款金额服从正态分布,能否利用本章所讲解的功能,找到存款金额“与众不同”的样本,并说明理由。
对“将标准化得分另存为变量”打上勾,然后对数据编辑窗口中的最后一列变量标准化Z变量进行排序,并观察,找到它的绝对值大于3的都是“与众不同”的样本。
理由:
标准化值反映的是样本值与样本均值的差是几个标准差单位。
如果标准化值等于0,则表示该样本值等于样本均值;
如果标准化值大于0,则表示该样本值大于样本均值;
如果标准化值小于0,则表示该样本值小于样本均值。
如果标准化值的绝对值大于3,则可认为是异常值。
4、利用第2章第7题数据,结合被调查者的常住地或职业或年龄状况,分析储户的收入分布特征。
分析——描述统计——交叉表,选择常住地、职业、年龄到行中,选择收入水平到列中,勾选“显示复式条形图”。
点击单元格——选择观测值、期望、行、列、合计。
点击统计量——选择卡方。
点击继续。
确定
利用列联分析实现。
首先编制列联表,然后进行卡方检验。
以户口和收入的列联分析为例:
表中,卡方统计量的观测值等于32.064,概率-P值等于0.001。
若显著性水平设为0.05,由于0.001<
0.05,拒绝原假设,表明户口地与收入水平不独立。
5、说明第2章第7题资料中的多选项问题是按照哪种拆分方式拆分的。
利用多选项分析被调查者本次存款的最主要目的是什么。
答:
第2章第7题资料的多选项问题是按照分类法拆分的。
目的是为了把多选项问题的分析转化为对多个问题的分析,即对多个SPSS变量的分析。
多选项分类法;
存款的最主要目的是正常生活零用
6、三代同堂的家庭中,婆婆与儿媳妇关系紧张的现象并不少见,为了了解住房条件对婆媳关系的影响,对600户家庭进行了调查并进行了列联分析,如下表:
1)补充表中第一行和第四行空缺的计算结果。
2)写出卡方检验的统计量并说明其构造基本原理。
3)婆媳关系与住房条件有无联系?
判断婆媳关系与住房条件有无关系:
因为P值为0.000,小于显著性水平0.01,属于高度显著,拒绝原假设,所以婆媳关系与住房条件有关系。
计算结果:
卡方统计量:
,用于测度各个单元格的观测频数与期望频数的差异,并依卡方理论分布判断差异是否统计显著。
由于期望频数代表的是行列变量独立下的分布,所以卡方值越大表明实际分布与期望分布差异越明显。
本例中,由于概率P值小于显著性水平,应拒绝原假设,婆媳关系与住房条件有关系。
7、利用第2章第4题资料,分析两种减肥产品所产生的效果分布是否一致。
分析——描述统计——交叉表,选择“产品类型”到行,选择“体重变化”到列。
点击统计量——勾选卡方。
点击单元格——选择观察值、期望值、行、列、总计。
点击继续,确定。
将计数数据还原为原始数据,采用交叉分组下的频数分析,并进行卡方检验。
表中,卡方统计量观测值为4.339,对应的概率P-值为0.037,小于显著性水平0.05,应拒绝原假设,说明减肥效果并不一致。
8、根据第2章第8题数据,回答以下问题:
(1)该问卷中的多选项问题是按照哪种方式分解的?
(2)请给出调查问卷数排在前三位的城市编码。
这三个城市的有效问卷共有多少份?
(3)股民中有多大比例的人赚钱了?
有多大比例的人亏钱了?
(4)股民买卖股票主要依据的是哪种办法?
股民买卖股票最少依据的是哪种办法?
(5)要研究专职投资者与业余投资者在股票投资结果上是否有差异,请给出你的分析思路、计算结果和分析绪论。
(1)多选项二分法;
(2)
102(794份)、101(514份)、401(400份)
(3)
赚钱比例:
30.3%,赔钱比例38%
(4)
主要依据:
基本因素法;
最少依据:
更跟方法
(5)
采用列联分析。
卡方检验结果表明:
专职和业余投资者在投资结果上存在显著差异。
9、为分析私家车主倾向接受的汽车销售价格是否与其居住地区有关,一家汽车企业的销售部门对东部地区、中部地区和西部地区的400名消费者作了抽样调查,得到如下结果:
汽车价格
东部地区
中部地区
西部地区
10万元以下
20
40
10万~20万元
50
60
20万~30万元
30
30万元以上
(1)指出表中所涉及的变量,并说明变量的类型。
(2)可使用哪种分析方法分析上表?
请说明分析的基本思路并利用SPSS进行分析。
(1)变量:
汽车价格、居住地区;
类型:
定序型变量、定类型变量
(2)上述是计数数据的组织方式,应首先组织到SPSS的数据编辑器窗口中,再利用交叉分组下的频数分析方法。
利用【交差表】来分析上表,步骤如下:
①先将上表中数据录入SPSS中。
共有400个个案。
②【分析】→【描述统计】→【交叉表】,将“地区”作为列变量,将“汽车价格”作为行变量,在【统计量】中选择“卡方”,在【单元格】中选择观察值、期望值、行、列和总计,得到分析结果。
③提出原假设:
认为地区和汽车价格无关系。
列联分析。
原假设:
不同居住区的私家车主接受的汽车价格具有一致性的。
上表可知,如果显著性水平为0.05,由于卡方检验的概率P-值小于显著性水平,因此应拒绝原假设。
由卡方检验表可知,渐进Sig(双侧)为0.000,如果认为显著性水平为0.05,因为0.000<
0.05,所以拒绝原假设,认为地区和汽车价格有关系,地区分布不同,汽车价格也不同。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计分析和SPSS的应用第五版 统计分析 SPSS 应用 第五 课后 练习 答案 解析