应用统计学.docx
- 文档编号:28488334
- 上传时间:2023-07-14
- 格式:DOCX
- 页数:64
- 大小:372.25KB
应用统计学.docx
《应用统计学.docx》由会员分享,可在线阅读,更多相关《应用统计学.docx(64页珍藏版)》请在冰豆网上搜索。
应用统计学
【1、1】指出下列变量得类型:
(1)汽车销售量;
(2)产品等级;
(3)到某地出差乘坐得交通工具(汽车、轮船、飞机);
(4)年龄;
(5)性别;
(6)对某种社会现象得瞧法(赞成、中立、反对)。
【解】(1)数值型变量
(2)顺序变量
(3)分类变量
(4)数值型变量
(5)分类变量
(6)顺序变量
【1、2】某机构从某大学抽取200个大学生推断该校大学生得月平均消费水平。
要求:
(1)描述总体与样本。
(2)指出参数与统计量。
(3)这里涉及到得统计指标就是什么?
【解】
(1)总体:
某大学所有得大学生
样本:
从某大学抽取得200名大学生
(2)参数:
某大学大学生得月平均消费水平
统计量:
从某大学抽取得200名大学生得月平均消费水平
(3)200名大学生得总消费,平均消费水平
【1、3】下面就是社会经济生活中常用得统计指标:
①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数.
在这些指标中,哪些就是数量指标,哪些就是质量指标?
如何区分质量指标与数量指标?
【解】数量指标有:
①、②、⑤
质量指标有:
③、④、⑥、⑦、⑧
数量指标就是说明事物得总规模、总水平或工作总量得指标,表现为绝对数得形式,并附有计量单位。
而质量指标就是说明总体相对规模、相对水平、工作质量与一般水平得统计指标,通常就是两个有联系得统计指标对比得结果。
【1、4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%得居民对自己得居住环境表示满意,70%得居民回答她们得月收入在6000元以下,生活压力大.
回答以下问题:
(1)这一研究得总体就是什么?
(2)月收入就是分类变量、顺序变量还就是数值型变量?
(3)对居住环境得满意程度就是什么变量?
【解】
(1)这一研究得总体就是某小区得所有居民。
(2)月收入就是数值型变量
(3)对居住环境得满意程度就是顺序变量。
第二章 统计数据得搜集
【2、1】从统计调查对象包括得范围、调查登记时间就是否连续、搜集资料得方法就是否相同等方面,对以下统计调查实例分类,并指出各属于那种统计调查方式.
(1)2004年,对我国得工业企业从业人数进行调查,各企业按上级部门要求填报统计表;
(2)2004年,对全国所有第二、第三产业活动单位进行基本情况摸底调查,以2004年12月31日为标准时点,调查2004年度得资料;
(3)对进口得一批产品,抽检其中少部分以对整批产品质量进行评价;
(4)要了解全国粮食产量得基本情况,只要对全国几个重点粮食产区进行调查,就能及时地对全国粮食产量得基本情况进行推断;
(5)为了探讨一项新改革措施实施得效果,推广其成功得经验,对已采取改革措施并产生明显效果得代表性单位进行调查。
【解】(1)得调查方式就是统计报表制度
(2)得调查方式就是普查
(3)得调查方式就是抽样调查
(4)得调查方式就是重点调查
(5)得调查方式就是典型调查
【2、2】某调查机构从某小区随机地抽取了50位居民作为样本进行调查,其中60%得居民对自己得居住环境表示满意,70%得居民回答她们得月收入在6000元以下,生活压力大.
回答下列得问题:
(1)这里用到什么调查方式?
(2)这里涉及得数据有哪些?
哪些就是截面数据,哪些就是动态数据?
【解】(1)这里用到得调查方式就是抽样调查.
(2)这里涉及得数据主要有:
居民对居住环境得态度、月收入,这些数据都就是截面数据。
第三章统计数据得整理与显示
【3、1】已知40名消费者购买5种不同款式得手机,分别就是:
A、诺基亚 B、摩托罗拉C、波导 D、联想 E、西门子.她们购买得情况如下表所示:
A
B
D
B
E
B
C
D
B
A
B
E
D
A
A
E
C
E
E
D
B
E
B
A
D
A
C
A
A
D
E
B
E
C
A
C
C
B
A
C
要求:
(1)指出上面得数据属于什么类型?
(2)用Excel制作一张频数分布表.
(3)绘制一张条形图与一张饼图,反映各类别得频数分布情况。
【解】
(1)上面数据属于分类型数据
(2)频数分布表如下表所示:
类别
频数
比例
百分比(%)
A
10
0、25
25
B
9
0、225
22、5
C
7
0、175
17、5
D
6
0、15
15
E
8
0、20
20
(3)条形图如下所示
饼图如下图所示
【3、2】已知40份用于购买汽车得个人贷款数据:
93
124
5
1640
1217
2235
957
2111
445
783
872
638
3005
346
1590
11
72
423
747
256
119
592
655
要求:
(1)利用Excel得FREQUENCY函数进行统计分组整理,编制频数分布表,并计算出累积频数与累积频率.
(2)利用SPSS绘制直方图。
【解】
(1)Excel中得到得频数分布表
贷款数据
频数
频率(%)
向上累积
向下累积
频数
频率(%)
频数
频率(%)
0~5
00
500~1
34
85
1000~
18
45
1500~2
0
25
2000~25
2500以上
2
5
40
100
2
5
合计
40
100
–
–
–
–
(2)SPSS中绘制得直方图
【3、3】下表列出了最近某年5月15日美国30个城市得最低温度.要求做出
最低温度数据得茎叶图。
城
市
最低
温度
城
市
最低
温度
城
市
最低
温度
奥尔巴尼
39
哥伦比亚
47
洛杉矶
61
安克雷奇
47
哥伦布
40
孟菲斯
51
亚特兰大
46
达拉斯
68
纽约城
50
奥斯丁
66
底特律
43
菲克尼斯
74
伯明翰
42
韦恩堡
37
波特兰
53
波士顿
53
格林贝
38
旧金山
55
布法罗
44
檀香山
65
西雅图
50
卡斯帕
51
休斯顿
67
锡拉拉丘兹
43
芝加哥
45
杰克逊维尔
50
坦帕
59
克利夫兰
40
拉斯维加斯
63
华盛顿
52
【解】最低温度得茎叶图
最低温度 Stem-and—Leaf Plot
Frequency Stem &Leaf
3、00 3、 789
6、00 4 、002334
4、00 4 、5677
8、00 5、 00011233
2、005、 59
2、00 6、 13
4、00 6 、 5678
1、00 7、4
Stemwidth:
10
Eachleaf:
1case(s)
【3、4】下表列出了某班12名学生得身高、体重与肺活量得相关数据
学生编号
身高
体重
肺活量
1
135、1
32、0
1、75
2
139、9
30、4
1、75
3
163、6
46、2
2、75
4
146、5
33、5
2、50
5
156、2
37、1
2、75
6
156、4
35、5
2、00
7
167、8
41、5
2、75
8
149、7
31、0
1、50
9
145、0
33、0
2、50
10
148、5
37、2
2、25
11
165、5
49、5
3、00
12
135、0
27、6
1、25
要求:
绘制出不同学生得身高、体重与肺活量得箱线图。
【解】12名学生身高、体重、肺活量得箱线图
【3、5】据《中国统计年鉴、2005年》,1998~2004年中国对外贸易进出口数据
如下:
(单位:
亿美元)
年份
1998
1999
2
2003
2004
出口总额
2
266
33
进口总额
14
436
2952
4128
5612
要求:
在同一坐标系内绘制出出口总额、进口总额得时间序列线图.
【解】出口总额与进口总额得线图
【3、6】从某一行业中随机抽取12家企业,所得产量与生产费用得数据如下:
企业编号
产量
生产费用
1
40
130
2
42
150
3
50
155
4
55
140
5
65
150
6
78
154
7
84
165
8
100
170
9
116
167
10
125
180
11
130
175
12
140
185
要求:
绘制产量与生产费用得散点图。
【解】产量与生产费用之间得散点图
第四章 统计描述
【4、1】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%.试分别计算产量、成本、劳动生产率得计划完成程度。
【解】产量得计划完成程度=
即产量超额完成12、5%.
成本得计划完成程=
即成本超额完成3、16%。
劳动生产率计划完=
即劳动生产率超额完成1、85%。
【4、2】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量得0、1%,在五年中,该矿实际开采原煤情况如下(单位:
万吨)
年份
1991年
1992年
1993年
1994年
1995年
上半年
下半年
上半年
下半年
实际开采量
9
325
470
535
累计开采量
试计算该煤矿原煤开采量五年计划完成程度及提前完成任务得时间。
【解】本题采用累计法:
(1)该煤矿原煤开采量五年计划完成=
=
即:
该煤矿原煤开采量得五年计划超额完成26、75%.
(2)将1991年得实际开采量一直加到1995年上半年得实际开采量,结果为2000万吨,此时恰好等于五年得计划开采量,所以可知,提前半年完成计划。
【4、3】我国1991年与1994年工业总产值资料如下表:
1991年
1994年
数值(亿元)
比重(%)
数值(亿元)
比重(%)
轻工业总产值
13800、9
21670、6
重工业总产值
14447、1
29682、4
工业总产值
28248
51353
要求:
(1)计算我国1991年与1994年轻工业总产值占工业总产值得比重,填入表中;
(2)1991年、1994年轻工业与重工业之间就是什么比例(用系数表示)?
(3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几?
【解】
(1)
1991年
1994年
数值(亿元)
比重(%)
数值(亿元)
比重(%)
轻工业总产值
13800、9
48、86%
21670、6
42、20%
重工业总产值
14447、1
51、14%
29682、4
57、8%
工业总产值
28248
—-
51353
——
(2)就是比例相对数;
1991年轻工业与重工业之间得比例=;
1994年轻工业与重工业之间得比例=
(3)
即,94年实际比计划增长25、37%.
【4、4】某乡三个村2000年小麦播种面积与亩产量资料如下表:
村
名
亩产量
(斤)
播种面积
亩数(亩)
所占比重(%)
甲
700
120
乙
820
150
丙
650
130
合计
要求:
(1)填上表中所缺数字;
(2)用播种面积作权数,计算三个村小麦平均亩产量;
(3)用比重作权数,计算三个村小麦平均亩产量。
【解】(1)
村
名
亩产量
(斤)
播种面积
亩数(亩)
所占比重(%)
甲
700
120
30%
乙
820
150
37、5%
丙
650
130
32、5%
合计
—-
400
100%
(2)
(3)
【4、5】两种不同品种得玉米分别在五块地上试种,产量资料如下:
甲品种
乙品种
田块面积(亩)
总产量(斤)
田块面积(亩)
总产量(斤)
0、8
840
0、9
630
0、9
810
1
1200
1
1100
1、3
1170
1、1
1040
1、3
1300
1、2
1200
1、5
1680
5
4990
6
5980
已知生产条件相同,对这两种玉米品种进行分析比较,试计算并说明哪一种品种得亩产量更稳定一些?
【解】
即:
由于就是总体数据,所以计算总体均值:
计算表格
甲品种
田块面积(亩)
总产量(斤)
亩产量
0、8
840
1050
0、9
810
900
1
1100
1100
1、1
1040
945、45
1、2
1200
1000
总计:
5
4990
—
乙品种
田块面积(亩)
总产量(斤)
亩产量
0、9
630
700
1
1200
1200
1、3
1170
900
1、3
1300
1000
1、5
1680
1120
总计:
6
5980
-
下面分别求两块田地亩产量得标准差:
要比较两种不同玉米得亩产量得代表性,需要计算离散系数:
乙企业得产品平均单位成本更低。
【4、7】某粮食储备库收购稻米得价格、数量及收购额资料如下:
等级
单价(元/斤)
收购量(万斤)
收购额(万元)
一级品
1、2
2000
2400
二级品
1、05
3000
3150
三级品
0、9
4000
3600
要求:
(1)按加权算术平均数公式计算稻米得平均收购价格;
(2)按加权调与平均数公式计算稻米得平均收购价格。
【解】(1)
(2)
【4、8】已知我国1995年-1999年末总人口及人口增长率资料:
年份
1994
1995
1996
1997
1998
1999
年末总人口(万人)
11985
89
123626
124810
125909
人口增长率(‰)
11、6
10、47
10、11
10、1
9、58
8、81
试计算该期间我国人口平均增长率。
【解】计算过程如下:
年份
1994
1995
1996
1997
1998
1999
年末总人口(万人)
11985
89
123626
124810
125909
年内总人口数(万人)
—-
12
23
5360
按照平均增长率得公式可知:
所以,1995年—1999年期间我国人口平均增长率=‰
【4、9】某单位职工按月工资额分组资料如下:
按月工资额分组(元)
职工人数(人)
人数所占比重(%)
4000元以下
25
10、59
5、68
56、78
2、71
7000以上
10
4、24
总计
236
100、00
根据资料回答问题并计算:
(1)它就是一个什么数列?
(2)计算工资额得众数与中位数;
(3)分别用职工人数与人数所占比重计算平均工资。
结果一样吗?
(4)分别计算工资得平均差与标准差。
【解】
(1)就是等距分组数列
(2)
即:
(注:
用上限公式算出得结果与上述结果相同)
(注:
用上限公式算出得结果与上述结果相同)
(3)
两者结果一样.(忽略小数点位数得保留对结果造成得影响)
(4)平均差
标准差
【4、10】某市甲、乙两商店把售货员按其人均年销售额分组,具体资料如下:
甲商场
乙商场
按销售额分组(万元)
售货员人数(人)
按销售额分组(万元)
售货员人数(人)
20—30
30
30-40
20
30—40
110
40—50
80
40-50
90
50-60
55
50-60
60
60-70
40
60以上
10
70以上
5
合计
300
合计
200
要求:
(1)分别计算这两个商场售货员得人均销售额;
(2)通过计算说明哪个商场人均销售额得代表性大?
【解】
(1)
(2)
,
乙商场销售额得代表性大。
第五章 统计抽样
【5、1】袋中装有5只同样大小得球,编号为1,2,3,4,5,从中同时取出3只球,求取出得最大号得分布律及其分布函数并画出其图形。
【解】先求得分布律:
由题知,得可能取值为3,4,5,且
,
得分布律为:
,
由得:
【5、2】设得密度函数为
求:
(1)常数c;
(2)得分布函数;
(3)。
【解】(1)
(2)当时,;
当时,
当时,、
故分布函数
(3)
【5、3】随机变量相互独立,又,,试求与
。
【解】
【5、4】一本书排版后一校时出现错误处数服从正态分布,
求:
(1)出现错误处数不超过230得概率;
(2)出现错误处数在190~210得概率。
【解】
(1)
(2)
【5、5】某地区职工家庭得人均年收入平均为12000元,标准差为2000元。
若知该地区家庭得人均年收入服从正态分布,现采用重复抽样从总体中随机抽取25户进行调查,问出现样本均值等于或超过12500元得可能性有多大?
【解】对总体而言,
样本均值
【5、6】某商场推销一种洗发水。
据统计,本年度购买此种洗发水得有10万人,其中3万6千人就是女性.如果按重复抽样方法,从购买者中抽出100人进行调查,问样本中女性比例超过50%得可能性有多大?
【解】总体比例即
第六章 统计推断
【6、1】采取重复抽样得方法,从某总体中抽取样本容量为250得一组样本,已知样本成数(比例)p=0、38,试计算样本成数(比例)得估计误差及抽样标准差。
【解】样本比例得估计误差为:
抽样标准差为:
【6、2】抽取一个样本容量为100得随机样本,其均值为36,标准差为7。
试求总体均值95%得置信区间.
【解】因为就是大样本,总体方差未知,
所以总体均值95%得置信区间为:
【6、3】随机抽取一个由360名教师组成得样本,让每个人对一些说法表明自己得态度.第一种说法就是“年龄偏大得学生对班上得讨论比年龄小得学生更积极”。
态度按5分制来衡量:
1=非常同意;2=同意;3=没有意见;4=不同意;5=很不同意。
对这一瞧法,样本得平均态度得分为2、08,标准差为0、95.试用98%得置信度估计教师对这一瞧法得平均态度得分得置信区间。
【解】因为就是大样本,总体方差未知,
所以总体均值得98%得置信区间为:
【6、4】税务管理官员认为,大多数企业都有偷税漏税行为.在对由750个企业构成得随机样本得检查中,发现有121个企业有偷税漏税行为。
试以90%得置信度估计偷税漏税企业比例得置信区间.
【解】因为满足大样本,且样本比例为:
所以,偷税漏税企业比例90%得置信区间为:
【6、5】为估计自考学生得平均年龄,随机抽取一个样本容量为64得样本,其中平均年龄为26、5岁,标准差为4岁,试求自考学生总体平均年龄得99%得置信区间.
【解】因为就是大样本,总体方差未知,
所以总体均值95%得置信区间为:
【6、6】销售公司要求销售人员与顾客经常保持联系。
一项由60名销售人员组成得随机样本表明:
销售人员每周与顾客保持联系得平均次数为21、5次,样本标准差为4次.试求销售人员每周与顾客保持联系得总平均次数95%得置信区间。
【解】因为就是大样本,总体方差未知,
所以总体均值95%得置信区间为:
【6、7】某地区调查下岗职工中女性得比例,随机抽取了49名下岗职工,其中25人为女性,现以90%得置信度估计该地区下岗职工中女性比例得置信区间。
【解】因为满足大样本,且样本比例为:
所以,该地区下岗职工中女性比例得90%得置信区间为:
【6、8】某健康机构想估计现代白领员工平均每天参加体育锻炼得时间。
从16家公司中随机抽取25名白领员工,得知:
其平均每天锻炼得时间为54分钟,标准差为30分钟。
假设白领员工每天参加体育锻炼得时间服从正态分布。
试求在95%得置信度下白领员工平均每天参加体育锻炼时间得置信区间。
【解】因为就是正态总体、小样本、方差未知
所以,白领员工平均每天参加体育锻炼时间得95%得置信区间为:
【6、9】某县城妇联要估计该地区职业女性平均每天得家务劳动时间,根据以往数据显示,该地区职业女性平均每天家务劳动时间得标准差为2小时。
已知该地区得职业女性共有5000名,要求估计误差不超过1、5小时,假设采取不重复抽样,问:
在95%得置信度下应该抽取多大得样本?
【解】不重复抽样条件下,关于均值得样本量确定公式为:
ﻩ
(注:
将题目中得估计误差1、5小时改为0、5小时)
【6、10】某省进行人口出生率得调查,根据以往得资料,该省得人口出生率约为10‰。
若要求估计误差不超过5%,置信度为95%,在重复抽样条件下,应该抽取多大得样本?
【解】重复抽样条件下,关于比例得样本量确定公式为:
(注:
将题目中得估计误差5%改为5‰)
【6、11】设某厂生产得一种灯管得寿命,从过去较长一段时间得生产情况来瞧,灯管得平均寿命小时,现在采用新工艺后,在所生产得灯管中抽取36只,测得平均寿命小时,问采用新工艺后,灯管寿命就是否有显著提高?
()
【解】根据题意,要检验采用新工艺后,灯管寿命就是否有显著提高,因此采用单侧检验。
建立得假设为:
已知,,,,,因为就是大样本,所以采用Z检验统计量。
,
因为,所以拒绝原假设,即采用新工艺后,灯管寿命有显著提高。
【6、12】已知普通成年人安静时得心率服从正态分布,其平均数就是72次/min。
现从某体院随机抽测64名男生,测得安静时心率平均数为68次/min,标准差为6、4次/min,试问某体院男生安静时心率与普通成年人得心率有无差异?
()
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学