社会统计学Word文档下载推荐.docx
- 文档编号:19469534
- 上传时间:2023-01-06
- 格式:DOCX
- 页数:22
- 大小:39.57KB
社会统计学Word文档下载推荐.docx
《社会统计学Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《社会统计学Word文档下载推荐.docx(22页珍藏版)》请在冰豆网上搜索。
2
60
29
65
56
93
83
110
80
3
30
57
85
84
111
87
4
31
78
58
68
112
66
5
32
59
113
6
33
95
114
7
61
91
115
8
64
35
62
90
89
76
116
9
51
36
63
117
81
10
37
96
118
11
38
92
119
12
50
39
72
120
13
40
67
94
121
14
41
74
44
122
15
42
69
123
16
43
73
97
124
17
98
125
18
45
99
126
77
19
46
79
100
127
20
47
101
128
54
21
48
75
102
129
22
49
103
130
23
104
131
24
105
132
25
52
106
133
26
53
107
134
27
108
135
答:
考试成绩按低至高排序如下表:
频数分布表
新成绩
频率
百分比
有效百分比
累积百分比
有效
9.6
20.7
30.4
11.9
42.2
16.3
58.5
5.9
64.4
3.0
67.4
8.9
76.3
5.2
81.5
3.7
85.2
2.2
87.4
12.6
100.0
合计
绘制频数分析统计图
形成性考核作业二(第4章至第6章)
表1为某大学对100个学生进行了一周的上网时间调查,请用SPSS软件:
(1)计算学生上网时间的中心趋势测量各指标(20分)和离散趋势测量各指标(30分)。
(2)计算学生上网时间的标准分(Z值)及其均值和标准差。
(20分)
(3)假设学生上网时间服从正态分布,请计算一周上网时间超过20小时的学生所占比例。
(30分)
表1某专业一年级同学一周上网时间(小时)
上网时间
(1)计算学生上网时间的中心趋势测量各指标和离散趋势测量各指标
统计量
N
缺失
均值
15.20
中值
14.00
众数
标准差
6.286
方差
39.515
全距
百分位数
10.00
20.00
(2)计算学生上网时间的标准分(Z值)及其均值和标准差
描述统计量
有效的N(列表状态)
Z值
-0.35
0.45
-0.19
-1.15
-0.83
-0.99
1.08
-1.3
0.6
1.4
0.76
-0.51
0.92
0.13
1.72
-1.62
-1.94
2.67
2.35
2.04
-0.03
0.29
.0000
1.00002
(3)假设学生上网时间服从正态分布,请计算一周上网时间超过20小时的学生所占比例。
上网时间>
20(FILTER)
小于等于20小时
79.0
大于20小时
21.0
形成性考核作业三(第1章至第12章)
一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确答案的序号,填写在题中的括号内。
每小题2分,共20分)
1.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。
这项研究的总体是(A)
A.22000名学生
B.2200名学生
C.22000名学生的每月生活费用
D.2200名学生的每月生活费用
2.从变量分类看,下列变量属于定序变量的是(C)
A.专业
B.性别
C.产品等级
D.收入
3.在频数分布表中,比率是指(D)
A.各组频数与上一组频数之比
B.各组频数与下一组频数之比
C.各组频数与总频数之比
D.不同小组的频数之比
4.某地区2001-2010年人口总量(单位:
万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据(D)
A.茎叶图
B.环形图
C.饼图
D.线图
5.根据一个样本均值求出的90%的置信区间表明(C)
A.总体均值一定落入该区间内
B.总体均值有90%的概率不会落入该区间内
C.总体均值有90%的概率会落入该区间内
D.总体均值有10%的概率会落入该区间内
6.判断下列哪一个不可能是相关系数(C)
A.-0.89
B.0.34
C.1.32
D.0
7.期中考试中,某班级学生统计学平均成绩为80分,标准差为4分。
如果学生的成绩是正太分布,可以判断成绩在72分-88分之间的学生大约占总体的(A)
A.95%
B.68%
C.89%
D.90%
8.正态分布中,σ值越小,则(A)
A.离散趋势越小
B.离散趋势越大
C.曲线越低平
D.变量值越分散
9.下面哪一项不是方差分析中的假定(D)
A.每个总体都服从正态分布
B.观察值是相互独立的
C.各总体的方差相等
D.各总体的方差等于0
10.对消费的回归分析中,学历、年龄、户口、性别、收入都是因变量,其中收入的回归系数为0.8,这表明(A)
A.收入每增加1元,消费增加0.8元
B.消费每增加1元,收入增加0.8元
C.收入与消费的相关系数为0.8
D.收入对消费影响的显著性为0.8
二、名词解释(每题4分,共20分)
1.抽样单位与抽样框:
抽样单位就是一次直接的抽样所使用的基本单位。
抽样框是指一次直接抽样时样本中所有抽样单位的名单。
2.均值:
均值是集中趋势最主要的测量值,它是将全部数据进行加总然后除以数据总个数,也称为算数平均数。
均值包含一组数据中所有数值,它是先将所有数值进行加总,然后进行平均,在均值中所有数值都有所体现。
因而,我们说均值是集中趋势最主要的测量值。
3.散点图:
散点图是在坐标系中,用X轴表示自变量x,用Y轴表示因变量y,而变量组(x,y)则用坐标系中的点表示,不同的变量组在坐标系中形成不同的散点,用坐标系及其坐标系中的散点形成的二维图就是散点图。
散点图是描述变量关系的一种直观方法,从散点图中直观的看出两个变量之间是否存在相关关系、是正线性相关还是负线性相关,也可以大致看出变量之间关系强度如何,但是对于具体关系强度则需要相关系数来判断。
4.抽样分布:
抽样分布是指样本统计量的概率分布,它是在重复选取容量为n的样本时,由每个样本计算出来的统计量数值的相对频数分布。
例如样本均值的分布、样本比例分布等。
5.虚无假设与替换假设:
将需要通过样本信息来推断其正确与否的命题称为虚无假设,也成为原假设或者零假设,通常用
表示。
如果虚无假设不成立,我们就拒绝虚无假设,需要在另个一假设中进行选择,这就是替换假设,替换假设通常用
上面例子中,虚无假设为:
:
μ=1800替换假设为:
μ≠1800a。
三、简答题(每题10分,共30分)
1.等距分组和不等距分组有什么区别?
请举例说明。
在对数据进行分组时,如果分组组距相等,就是等距分组,如:
学生平均每天上网时间:
组距设3,分成3-6,6-9,9-12,12-15共4个小组。
如果分组组距不相等,就是不等距分组。
如:
人口分析,分婴幼儿组(0-6),少儿组(7-17),中青年组(18-59),老人组(60-130),组距不相等。
2.简述定类变量、定序变量和数值型变量集中趋势测量的方法。
定序变量是层次最低的变量,用众数作为其中心趋势的测量,定序变量主要使用中位数、四分位数作为集中趋势的测量,同时也可以使用众数作位测量值,但是中位数和四分位数利用序次关系,因而更多使用这两者,数值里数据(定距河定比数据)的集中趋势测量指标是平均数,同样数值型数据使用众数和中位数、四分位数作位中心趋势的测量,但是更主要是使用均值,因为均值利用所有数据信息。
3.如何对配对样本进行t检验。
可运用以下2种方法对配对样本进行t检验
配对样本T检验方法:
配对样本检验主要是判断不同的处理或试验结果是否有差异。
配对样本T检验(Paired—SampleTtest)用于检验两个相关的样本(配对样本)是否来自具有相同均值的总体,因此针对配对样本我们可以首先计算出两个样本每个对应变量间的差值,然后再检验其差值的均值是否为零,若均值接近于零(即在给定的置信区间内),说明两个样本均值在给定的置信水平上没有差异;
若均值在给定置信区间以外,说明两个样本均值在给定的置信水平上有差异。
=
四、计算题(每题15分,共30分)
1.某大学针对某项政策的态度调查,随机抽取300名被调查者,了解对政策的观点,调查结果见表1所示。
(15分)
表1对某项政策态度的调查结果
教师
学校领导
赞同
141
反对
中立
300
要求:
(1)利用原始数据绘制包含百分比的二维表,并对绘制的列联表加以简要说明;
68.0
57.0
16.0
141.0
行百分比(%)
48.2
40.4
11.3
——
列百分比(%)
53.5
42.5
41.0
总百分比(%)
22.7
19.0
5.3
47.0
34.0
10.0
85.0
40.0
11.8
26.8
30.6
25.6
13.7
3.3
28.3
25.0
36.0
13.0
74.0
33.8
48.6
17.6
19.7
26.9
33.3
8.3
12.0
4.3
24.7
127.0
134.0
39.0
300.0
42.3
44.7
简要说明:
学生赞同人数所占行比例、列比例、总比例越多,教师反对人数所占行比例、列比例、总比例与多,学校领导中立的列比例最大,教师中立的行百分比和总百分比越大。
(2)并计算γ系数,并进行说明、
NS=68*(36+13+41+10)+57*(13+10)+25*(41+10)+36*10
=6800+1311+1275+360
=9746
ND=16*(5+36+34+41)+57*(25+34)+13*(34+41)+36*34
=2176+3363+975+1224
=7738
G=(NS-ND)/(NS+ND)
=(9746-7738)/(9746+7738)=2008/17484=11.5%
说明:
可见学生、教师和学校领导对某项政策的态度成正相关关系。
2.某汽车生产商欲了解广告费用(万元)对销售量(辆)的影响。
收集了过去12年的有关数据,通过分析得到:
方程的截距为363,回归系数为1.42,回归平方和SSR=1600,残差平方和SSE=450。
要求:
(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会 统计学