必修三第二章学案.docx
- 文档编号:26174807
- 上传时间:2023-06-17
- 格式:DOCX
- 页数:21
- 大小:63.68KB
必修三第二章学案.docx
《必修三第二章学案.docx》由会员分享,可在线阅读,更多相关《必修三第二章学案.docx(21页珍藏版)》请在冰豆网上搜索。
必修三第二章学案
第二章统计
2.1随机抽样
2.1.1简单随机抽样
【填一填】
1.总体与个体
一般把所考察对象的某一数值指标的构成的集合看作总体,构成总体的作为个体,从总体中抽出若干个体所组成的集合叫做
2.随机抽样
在抽样时要保证每一个个体都,每一个个体被抽到的机会是,满足这样的条件的抽样是随机抽样.
3.简单随机抽样
一般地,从元素个数为N的总体中抽取容量为n的样本,如果每一次抽取时总体中的各个个体有的可能性被抽到,这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做
4.常用的简单随机抽样方法有和.
【典型例题】
例1 人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?
跟踪训练1 下列抽样的方式是否属于简单随机抽样?
为什么?
(1)从无限多个个体中抽取50个个体作为样本.
(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子.
例2 假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表法抽取样本时应如何操作?
跟踪训练2 某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?
【练一练】
1.为了了解某市高三毕业生升学考试中数学成绩的情况,从参加考试的学生中随机地抽查了1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是( )
A.总体指的是该市参加升学考试的全体学生
B.个体指的是1000名学生中的每一名学生
C.样本容量指的是1000名学生
D.样本是指1000名学生的数学升学考试成绩
2.在简单随机抽样中,某个个体被抽中的可能性是( )
A.与第几次抽样有关,第1次抽中的可能性要大些
B.与第几次抽样无关,每次抽到的可能性都相等
C.与第几次抽样有关,最后一次抽中的可能性大些
D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取
的可能性不一样
3.抽签法中确保样本代表性的关键是( )
A.制签B.搅拌均匀
C.逐一抽取D.抽取不放回
【小结】
1.简单随机抽样是一种简单、基本、不放回的抽样方法,常用的简单随机抽样方法有抽签法和随机数表法.
2.抽签法的优点是简单易行,缺点是当总体的容量大时,费时、费力,并且标号的签不易搅拌均匀,这样会导致抽样不公平;随机数表法的优点也是简单易行,缺点是当总体容量大时,编号不方便.两种方法只适合总体容量较少的抽样类型.
3.简单随机抽样中每个个体入样的可能性都相等,均为n/N,但要将每个个体入样的可能性与第n次抽取时每个个体入样的可能性区分开,避免在解题中出现错误.
2.1.2 系统抽样
【填一填】
1.系统抽样的概念
将总体分成的若干部分,然后按照预先制定的规则,从每一部分抽取个体,得到所需要的样本,这种抽样的方法叫做系统抽样.在抽样过程中,由于抽样的间隔,因此系统抽样也称作抽样.
2.适用的条件总体中个体差异不大并且总体的容量
3.系统抽样的步骤
一般地,假设要从容量为N的总体中抽取容量为n的样本,可以按下列步骤进行系统抽样:
(1)先将总体的N个个体有时可直接利用个体自身所带的号码,如学号,准考证号,门牌号等;
(2)确定分段间隔k对编号进行分段,当
(n是样本容量)是整数时,取k=
;
(3)在第一段用确定一个个体编号s(s≤k);
(4)按照一定的规则抽取样本.通常是将s加上间隔k得到第2个个体编号s+k,再加k得到第3个个体编号,
依次进行下去,直到得到容量为n的样本.
【典型例题】
例1 下列抽样中不是系统抽样的是( )
A.从标有1~15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5,i+10(超过15则从1再数起)号入样
B.工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验
C.搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止
D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈
跟踪训练1 系统抽样适用的总体应( )
A.容量较小B.容量较大
C.个体数较多但不均衡D.任何总体
例2某校高中三年级的295名学生已经编号为1,2,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.
跟踪训练2 从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( )
A.5,10,15,20,25B.3,13,23,33,43
C.1,2,3,4,5D.2,4,6,16,32
例3为了解参加某种知识竞赛的1000名学生的成绩,从中抽取一个容量为50的样本,那么采用什么抽样方法比较恰当?
简述抽样过程.
跟踪训练3 某工厂有1003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施.
【练一练】
1.下列抽样问题中最适合用系统抽样法抽样的是( )
A.从全班48名学生中随机抽取8人参加一项活动
B.一个城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,要从中抽取一个容量为21的样本
C.从参加模拟考试的1200名高中生中随机抽取100人分析试题作答情况
D.从参加模拟考试的1200名高中生中随机抽取10人了解某些情况
2.为了了解参加一次知识竞赛的1252名学生的成绩,决定采用系统抽样的方法抽取一个容量为50的样本,那么总体中应随机剔除的个体数目是( )
A.2B.3C.4D.5
3.有20个同学,编号为1~20,现在从中抽取4人的作文卷进行调查,用系统抽样方法确定所抽的编号为( )
A.5,10,15,20B.2,6,10,14
C.2,4,6,8D.5,8,11,14
【小结】
系统抽样的优点是简单易操作,当总体个数较多的时候也能保证样本的代表性;缺点是对存在明显周期性的总体,选出来的个体往往不具备代表性.从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化的思想.
2.2用样本估计总体
2.2.1 用样本的频率分布估计总体的分布
(一)
【填一填】
1.极差的概念
极差是一组数据的 的差,它反映了一组数据 ,极差又叫.
2.频数、频率的概念
将一批数据按要求分为若干组,对落在各个小组内数据的 进行累计,这个累计数叫做各个小组的 ,各个小组的 除以 ,即得该小组的.
3.频率分布直方图
在频率分布直方图中,纵轴表示,各小长方形的面积等于,所有长方形面积之和等于.
例1 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:
cm).作出该样本的频率分布表,并估计身高不小于170(cm)的同学所占的百分率.
168
165
171
167
170
165
170
152
175
174
165
170
168
169
171
166
164
155
164
158
170
155
166
158
155
160
160
164
156
162
160
170
168
164
174
170
165
179
163
172
180
174
173
159
163
172
167
160
164
169
151
168
158
168
176
155
165
165
169
162
177
158
175
165
169
151
163
166
163
167
178
165
158
170
169
159
155
163
153
155
167
163
164
158
168
167
161
162
167
168
161
165
174
156
167
166
162
161
164
166
跟踪训练1 有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.
(1)列出学生参加运动队的频率分布表.
(2)画出频率分布条形图.
例2 为了了解中学生身体发育情况,对某中学17岁的60名女生的身高进行了测量,结果如下:
(单位:
cm)
154 159 166 169 159 156 166 162 158 159
156 166 160 164 160 157 151 157 161 162
158 153 158 164 158 163 158 153 157 168
162 159 154 165 166 157 155 146 151 158
160 165 158 163 163 162 161 154 165 161
162 159 157 159 149 164 168 159 153 160
列出样本的频率分布表;绘出频率分布直方图.
跟踪训练2 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:
cm).
区间界限
[122,126)
[126,130)
[130,134)
[134,138)
[138,142)
人数
5
8
10
22
33
区间界限
[142,146)
[146,150)
[150,154)
[154,158)
人数
20
11
6
5
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)估计身高小于134cm的人数占总人数的百分比.
【练一练】
1.有一个容量为45的样本数据,分组后各组的频数如下:
(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的( )
A.91%B.92%C.95%D.30%
2.一个容量为20的样本数据,数据的分组及各组的频数如下:
[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2.则样本在区间(10,50)上的频率为( )
A.0.5B.0.7C.0.25D.0.05
3.一个高中研究性学习小组对本地区2010年至2012年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如图),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭______万盒.
【小结】
1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律,我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.
2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式,用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.
3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚的看到整个样本数据的频率分布情况,并由此估计总体的分布情况.
2.2.1 用样本的频率分布估计总体的分布
(二)
【填一填】
1.频率分布折线图
把频率分布直方图中各个长方形用线段连接起来,就得到频率分布折线图.
2.总体密度曲线
如果样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近于总体在各个小组内所取值的 的大小;当样本容量不断增大,分组的组距不断缩小时,频率分布直方图实际上越来越接近于 ,它可以用一条来描绘,这条光滑曲线就叫做
3.茎叶图
用茎叶图表示数据的两个优点在于:
一是从茎叶图上没有 的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时,方便记录与表示.
探究点一 频率分布表及频率分布直方图的应用
例1 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12
(1)第二小组的频率是多少?
样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?
跟踪训练1 为了解经济林生长情况,随机测量其中的100株的底部周长,得到如下数据表(单位:
cm).
135
98
102
110
99
121
110
96
100
103
125
97
117
113
110
92
102
109
104
112
109
124
87
131
97
102
123
104
104
128
105
123
111
103
105
92
114
108
104
102
129
126
97
100
115
111
106
117
104
109
111
89
110
121
80
120
121
104
108
118
129
99
90
99
121
123
107
111
91
100
99
101
116
97
102
108
101
95
107
101
102
108
117
99
118
106
119
97
126
108
123
119
98
121
101
113
102
103
104
108
(1)编制频率分布表;
(2)绘制频率分布直方图;
(3)估计该片经济林中底部周长小于100cm的树木约占多少?
周长不小于120cm的树木约占多少?
例2用茎叶图表示样本数据:
3.1,2.5,2.0,0.8,1.5,1.3,4.3,2.7,3.1,3.5.
跟踪训练2 下面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据下图可知( )
甲
乙
0
8
5
0
1
2
4
7
3
2
2
1
9
9
8
7
5
4
2
1
3
3
6
9
4
4
4
1
5
2
A.甲运动员的成绩好于乙运动员
B.乙运动员的成绩好于甲运动员
C.甲、乙两名运动员的成绩没有明显的差异
D.甲运动员的最低得分为0分
例3 甲、乙两位同学在高三的5次月考中数学成绩统计如茎叶图所示,若甲、乙两人的平均成绩分别是x甲、x乙,则下列说法正确的是( )
甲
乙
8
7
2
7
8
6
8
8
8
2
9
1
0
A.x甲>x乙;乙比甲成绩稳定
B.x甲>x乙;甲比乙成绩稳定
C.x甲 D.x甲 跟踪训练3 某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是 8 9 8 7 9 2 x 3 4 2 1 ( ) A.5B.4C.3D.2 【练一练】 1.如图是总体密度曲线,下列说法正确的是( ) A.组距越大,频率分布折线图越接近于它 B.样本容量越小,频率分布折线图越接近于它 C.阴影部分的面积代表总体在(a,b)内取值的百分比 D.阴影部分的平均高度代表总体在(a,b)内取值的百分比 2.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( ) 8 9 7 9 3 1 6 4 0 2 A.91.5和91.5B.91.5和92 C.91和91.5D.92和92 【小结】 1.总体的分布分两种情况: 当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图. 2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作. 3.正确利用三种分布的描述方法,都能得到一些有关分布的主要特点(如分布是否具有单峰性、是否具有对称性、样本点落在各分组中的频率等),这些主要特点受样本的随机性的影响比较小,更接近于总体分布的相应的特点. 2.2.2 用样本的数字特征估计总体的数字特征 【填一填】 1.n个样本数据x1,x2,x3,…,xn的平均数 = . 2.一般地,设样本的元素为x1,x2,…,xn,样本的平均数为 定义s2= ,s= . 其中s2表示样本方差,s表示样本标准差. 例1 某公司的33名职工的月工资(单位: 元)如下表: 职业 董事长 副董事长 董事 总经理 经理 管理员 职员 人数 1 1 2 1 5 3 20 工资 5500 5000 3500 3000 2500 2000 1500 (1)求该公司职工月工资的平均数. (2)若董事长、副董事长的工资分别从5500元、5000元提升到30000元、20000元,那么公司职工新的平均数又是什么? 跟踪训练1 某工厂人员及工资构成如下: 人员 经理 管理人员 高级技工 工人 学徒 合计 周工资 2200 250 220 200 100 人数 1 6 5 10 1 23 (1)指出这个问题中周工资的平均数. (2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗? 为什么? 例2计算数据5,7,7,8,10,11的标准差. 跟踪训练2 求出导引中的甲乙两位运动员射击成绩的标准差,并说明他们的成绩谁比较稳定? 例3 甲、乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位: mm): 甲 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.44 25.40 25.42 25.35 25.41 25.39 乙 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 25.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.48 从生产的零件内径的尺寸看,谁生产的质量较高? (结果保留小数点后3位) 跟踪训练3 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位: t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定. 品种 第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙 9.4 10.3 10.8 9.7 9.8 【练一练】 1.下列说法正确的是( ) A.在两组数据中,平均值较大的一组方差较大 B.平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小 C.方差的求法是求出各个数据与平均值的差的平方后再求和 D.在记录两个人射击环数的两组数据中,方差大的表示射击水平高 2.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为( ) A. B. C. D.2 3.已知一组数据x1,x2,x3,x4,x5的平均数是 =2,方差是 那么另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数和方差分别为( ) A.2, B.2,1 C.4, D.4,3 【小结】 1.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差. 2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性. 3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案. 2.3变量的相关性 【填一填】 1.两个变量间的相互关系 变量与变量之间的关系常见的有两类: 一类是确定性的 关系,另一类是带有随机性的关系.在相关关系中又有和之分. 2.散点图 在一个统计数表中,为了更清楚地看出x和y是否具有相关关系,常将x的取值作为,将y的相应取值作为 ,在直角坐标中描点,这样的图形叫做散点图. 3.回归直线方程 一般地,设x和y是具有相关关系的两个变量,且对应于n个观测值的n个点大致分布在一条直线的附近,若所求的直线方程 = + x,则 我们将这个方程叫做y对x的, 叫做 ,相应的直线叫做回归直线. 4.最小二乘法 设x、Y的一组观
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 必修 第二 章学案