第十章统计与统计案例Word下载.docx
- 文档编号:15392482
- 上传时间:2022-10-29
- 格式:DOCX
- 页数:91
- 大小:692.05KB
第十章统计与统计案例Word下载.docx
《第十章统计与统计案例Word下载.docx》由会员分享,可在线阅读,更多相关《第十章统计与统计案例Word下载.docx(91页珍藏版)》请在冰豆网上搜索。
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
均为不放回抽样,且抽样过程中每个个体被抽取的机会相等
从总体中逐个抽取
是后两种方法的基础
总体中的个数较少
系统抽样
将总体均分成几部分,按事先确定的规则在各部分中抽取
在起始部分抽样时采用简单随机抽样
元素个数很多且均衡的总体抽样
分层抽样
将总体分成几层,分层按比例进行抽取
各层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
考点贯通抓高考命题的“形”与“神”
1.抽签法的步骤
第一步,将总体中的N个个体编号;
第二步,将这N个号码写在形状、大小相同的号签上;
第三步,将号签放在同一不透明的箱中,并搅拌均匀;
第四步,从箱中每次抽取1个号签,连续抽取k次;
第五步,将总体中与抽取的号签的编号一致的k个个体取出.
2.随机数法的步骤
第一步,将个体编号;
第二步,在随机数表中任选一个数开始;
第三步,从选定的数开始,按照一定抽样规则在随机数表中选取数字,取足满足要求的数字就得到样本的号码.
[例1]
(1)以下抽样方法是简单随机抽样的是( )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见
D.用抽签方法从10件产品中选取3件进行质量检验
(2)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
7816
6572
0802
6314
0702
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
A.08B.07
C.02D.01
[解析]
(1)选项A、B不是简单随机抽样,因为抽取的个体间的间隔是固定的;
选项C不是简单随机抽样,因为总体的个体有明显的层次;
选项D是简单随机抽样.
(2)由题意知前5个个体的编号为08,02,14,07,01.
[答案]
(1)D
(2)D
系统抽样的步骤
(1)先将总体的N个个体编号;
(2)确定分段间隔k(k∈N*),对编号进行分段.当(n是样本容量)是整数时,取k=;
(3)在第1段用简单随机抽样确定第1个个体编号l(l≤k);
(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.
[例2]
(1)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )
A.11B.12
C.13D.14
(2)中央电视台为了解观众对《中国好歌曲》的意见,准备从502名现场观众中抽取10%进行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除________个个体,抽样间隔为________.
[解析]
(1)由系统抽样定义可知,所分组距为=20,每组抽取一人,因为包含整数个组,所以抽取个体在区间[481,720]的数目为(720-480)÷
20=12.
(2)把502名观众平均分成50组,由于502除以50的商是10,余数是2,所以每组有10名观众,还剩2名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从502名观众中抽取2名观众,这2名观众不参加座谈;
再将剩下的500名观众编号为1,2,3,…,500,并均匀分成50段,每段含=10个个体.所以需剔除2个个体,抽样间隔为10.
[答案]
(1)B
(2)2 10
[易错提醒]
用系统抽样法抽取样本,当不为整数时,取k=,即先从总体中用简单随机抽样的方法剔除(N-nk)个个体,且剔除多余的个体不影响抽样的公平性.
进行分层抽样的相关计算时,常利用以下关系式巧解:
(1)=;
(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.
[例3]
(1)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )
人数
老年教师
900
中年教师
1800
青年教师
1600
合计
4300
A.90B.100
C.180D.300
(2)(2016·
东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=( )
A.54B.90
C.45D.126
(3)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:
人).
篮球组
书画组
乐器组
高一
45
30
a
高二
15
10
20
学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________.
[解析]
(1)设该样本中的老年教师人数为x,由题意及分层抽样的特点得=,故x=180.
(2)依题意得×
n=18,解得n=90,即样本容量为90.
(3)由题意知=,解得a=30.
[答案]
(1)C
(2)B (3)30
[方法技巧]
分层抽样的解题策略
(1)分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:
层内样本的差异要小,两层之间的样本差异要大,且互不重叠.
(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同.
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.
(4)抽样比==.
能力练通抓应用体验的“得”与“失”
1.某工厂的质检人员对生产的100件产品,采用随机数法抽取10件检查,对100件产品采用下面的编号方法
①1,2,3,…,100;
②001,002,…,100;
③00,01,02,…,99;
④01,02,03,…,100.
其中正确的序号是( )
A.②③④B.③④
C.②③D.①②
解析:
选C 根据随机数法编号可知,①④编号位数不统一.
2.为了调查老师对微课堂的了解程度,某市拟采用分层抽样的方法从A,B,C三所中学抽取60名教师进行调查,已知A,B,C三所学校中分别有180,270,90名教师,则从C学校中应抽取的人数为( )
A.10B.12
C.18D.24
选A 根据分层抽样的特征,从C学校中应抽取的人数为×
60=10.
3.某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号、29号、42号学生在样本中,那么样本中还有一个学生的学号是( )
A.10B.11
C.12D.16
选D 从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16,故选D.
4.某市有A、B、C三所学校,共有高三文科学生1500人,且A、B、C三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B校学生中抽取________人.
设A、B、C三所学校高三文科学生人数分别为x,y,z,由题知x,y,z成等差数列,所以x+z=2y,又x+y+z=1500,所以y=500,用分层抽样方法抽取B校学生人数为×
500=40.
答案:
40
5.为了了解本班学生对网络游戏的态度,高三(6)班计划在全班60人中展开调查,根据调查结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,为此先对60名学生进行编号为:
01,02,03,…,60,已知抽取的学生中最小的两个编号为03,09,则抽取的学生中最大的编号为________.
由最小的两个编号为03,09可知,抽取时的分段间隔是6.即抽取10名同学,其编号构成首项为3,公差为6的等差数列,故最大编号为3+9×
6=57.
57
突破点
(二) 用样本估计总体
1.频率分布直方图和茎叶图
(1)作频率分布直方图的步骤
①求极差(即一组数据中最大值与最小值的差);
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图.
(2)频率分布折线图和总体密度曲线
①频率分布折线图:
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
②总体密度曲线:
随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
(3)茎叶图的优点
茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.
2.样本的数字特征
(1)众数、中位数、平均数
数字特征
定义与求法
优点与缺点
众数
一组数据中重复出现次数最多的数
众数体现了样本数据的最大集中点,不受极端值的影响.但显然它对其他数据信息的忽视使得无法客观地反映总体特征
中位数
把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)
中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平均数
如果有n个数据x1,x2,…,xn,那么这n个数的平均数=
平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低
(2)标准差、方差
①标准差:
样本数据到平均数的一种平均距离,一般用s表示,s=.
②方差:
标准差的平方
s2=[(x1-)2+(x2-)2+…+(xn-)2],其中xi(i=1,2,3,…,n)是样本数据,n是样本容量,是样本平均数.
③方差与标准差相比,都是衡量样本数据离散程度的统计量,但方差因为对标准差进行了平方运算,夸大了样本的偏差程度.
(3)平均数、方差公式的推广
若数据x1,x2,…,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m+a,方差为m2s2.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十章 统计与统计案例 第十 统计 案例