培优导学计划高中数学 必修3 苏教版 第二章 统计 疑难规律方法Word格式.docx
- 文档编号:16785797
- 上传时间:2022-11-26
- 格式:DOCX
- 页数:14
- 大小:106.88KB
培优导学计划高中数学 必修3 苏教版 第二章 统计 疑难规律方法Word格式.docx
《培优导学计划高中数学 必修3 苏教版 第二章 统计 疑难规律方法Word格式.docx》由会员分享,可在线阅读,更多相关《培优导学计划高中数学 必修3 苏教版 第二章 统计 疑难规律方法Word格式.docx(14页珍藏版)》请在冰豆网上搜索。
简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:
放回和不放回.我们在抽样调查中用的是不放回抽取.当总体中的个体数较少且抽取的样本容量较小时,常采用简单随机抽样.下面让我们一同来看如下的例题:
例1判断下面的抽样方法是不是简单随机抽样?
(1)从不确定个体数的总体中抽取20个个体作为样本.
(2)从30瓶果汁中一次性随机抽取3瓶进行质量检查.
(3)某班有40名同学,指定个子最高的5名同学参加学校组织的篮球赛.
(4)从装有编号为1~36的大小、形状都相同的号签的盒子中逐个不放回地抽出6个号签.
分析 简单随机抽样的定义,抓住以下特点来理解:
①它要求被抽取的样本所在总体的容量确定且有限;
②它是从总体中逐个地进行抽取;
③它是一种不放回抽样;
④每个个体被抽到的可能性是相同的,是等可能抽样.
解
(1)不是简单随机抽样.因为总体的个体数是不确定的,从而不能保证每个个体等可能入样.
(2)不是简单随机抽样.因为简单随机抽样的定义要求的是逐个抽取.
(3)不是简单随机抽样.因为该例是指定个子最高的5名同学参加比赛,每个个体被抽到的可能性是不同的,不是等可能抽样.
(4)是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回地、等可能地进行抽样.
点评 要判断所给的抽样方法是不是简单随机抽样,关键是看它们是否符合简单随机抽样的定义,即简单随机抽样的上述四个特点.
例2若将例1
(2)中的字眼“一次性”改为“逐个”,则该例便为简单随机抽样.即从30瓶果汁中逐个随机抽取3瓶进行质量检查.请选用合适的抽样方法,写出抽样过程.
分析 简单随机抽样分为两种:
抽签法和随机数表法.当总体容量和样本容量都较小时,可采用抽签法进行抽样.
解
(1)将30瓶果汁进行编号,号码为1,2,3,…,30;
(2)将1~30这30个编号写到大小、形状都相同的号签上;
(3)将写好的号签放入一个不透明的容器中,并搅拌均匀;
(4)从容器中每次抽取一个号签,连续不放回地抽取3次,并记录下上面的编号;
(5)所得号码对应的3瓶果汁就是要抽取的样本.
点评 抽签法是简单随机抽样的一种方法,一个抽样试验是否能用抽签法,关键看两点:
一是制作号签是否方便;
二是号签是否容易被“搅拌均匀”.本题中,总体中个体数(30)较少,制作号签比较方便,并且容易被“搅拌均匀”,所以可以采用抽签法.
例3现在要考察某公司生产的2.5L的果汁质量是否达标,欲从400瓶果汁中抽取6瓶进行质量检查.请选用合适的方法抽样,并写出抽样过程.
分析 当总体容量较大,而样本容量较小时,因制签麻烦,故不宜用抽签法,可采用随机数表法.
解 选用随机数表法.
步骤如下:
第一步,先将400瓶果汁编号,可以编为001,002,…,400;
第二步,在随机数表中任选一个数作为开始,比如第6行第1个数,取出162作为抽取的6瓶果汁中的第一个代号(见课本后的附表随机数表);
第三步,继续向右读,每次读取三位,凡不在001~400中或重复的数跳过去不读,取到末尾时转到下一行从左到右继续读数,如此下去直到得出在001到400之间的6个三位数,分别为162,277,354,378,384,263;
第四步,找出与162,277,354,378,384,263对应的果汁作为样本.
点评 当总体中的个体较多,制作号签比较复杂,并且把号签搅拌均匀比较困难时,可以选择使用随机数表法,本题将个体编号的位数统一为3位.
使用随机数表法应注意以下两点:
(1)随机数表法要求对个体编号且每个个体的号码位数必须相同.如对100个个体编号时应从00编到99(或者从001编到100),而不能用1,2,…,100.可见在总体中的个体进行编号时要视总体中个体的数目而定,但必须保证所编号码的位数一致,不允许出现不同位数的号码.
(2)选定开始读的数后,读数的方向可左、可右、可上、可下,即任意方向均可.读数的方向不同可能导致不同的结果,但这一点不影响样本的公平性和合理性.
3 辨析三种抽样方法的合理选取
一、简单随机宜少量
例1据报道,2009年7月22日的“日全食”较为理想的观测地点有上海、重庆、苏州、杭州、合肥、武汉、宜昌、成都、乐山、嘉兴这10个城市.某天文小组从这10个城市中随机抽取4个城市进行观测,宜采用的抽样方法是______________,每个城市被选中的可能性是______________.
解析 由于总体中个体数目较少,所以宜采用简单随机抽样的方法进行抽样.每个城市被选中的可能性均相等,均为
=0.4.
答案 简单随机抽样 0.4
点评 本题中个体总数较少,使用简单随机抽样中的抽签法即可.可以直接把10个城市名分别写在10个大小相同的纸条上,将纸条放在一个盒子里摇匀,随机抽出4个即可.在整个抽样过程中可以保证每个个体被抽到的可能性相等,也可以进一步计算出相应的值.
二、差别明显选分层
例2网络上流行一种“QQ农场”游戏,这种游戏通过虚拟软件模拟种植与收获的过程.为了解某小区不同年龄层次的居民对此游戏的态度(小区中居民的年龄具有一定的差别),现从中抽取100人进行调查,结果如下表:
对游戏的态度
喜欢
不喜欢
不了解
人数
35
30
请问随机抽取这100人较合理的抽样方法是________,调查结果得出后,若想从这100人中再选取20人进行座谈,较合理的抽样方法是__________.若这个小区共有2000人,则每个人被抽到参加座谈的可能性为________.
解析 因为小区居民的年龄存在明显差异,故抽取这100人宜采用分层抽样.根据调查结果,有三种明显不同的态度,因此,选取20人参加座谈,也宜采用分层抽样.在整个抽样过程中,每个人被抽到的可能性是相同的,
均为
=0.01.
答案 分层抽样 分层抽样 0.01
点评 分层抽样的过程是先把有差别的个体进行分层,在每一层中可以采用简单随机抽样或系统抽样的方法,这样也能保证每个个体被抽到的可能性相同.
三、大量抽取选系统
例3为迎接30年店庆,某超市进行促销活动,为购买商品顾客分发了编号为0000~9999的奖券,超市计划从中抽取100张作为中奖号码,较合理的抽样方法是________,每张奖券中奖的可能性为________.
解析 由于奖券数量较大,有10000张奖券,所以宜采用系统抽样方法进行抽取.在抽样过程中,每张奖券被抽到的可能性是相等的,均为
答案 系统抽样 0.01
点评 当总体中个体数目较多时,首先把个体编号,进行平均分组(若不能整除,则随机剔除多余的个体),然后采用简单随机抽样的方法从第一组中抽取一个个体,即可知道应抽取的其他编号的个体.
4 解读用样本估计总体
一、用样本的频率分布估计总体分布
1.频率分布表:
反映具体数据落在各个区间的频率,但不够直观、形象,不利于分析数据分布的总体态势.
2.频率分布直方图:
能够非常直观的表明数据分布的形状,很好地反映数据的变化趋势,适用于样本数据较多的情况,但是从直方图本身得不到具体的数据内容.
3.频率分布折线图:
连结频率分布直方图中各小长方形上端的中点,就可以得到相应的频率分布折线图.其优点是能够清晰地反映数据的变化趋势.如果样本容量不断增加,分组的组距不断减小,那么折线图便会趋近于总体密度曲线.总体密度曲线精确地反映了总体在各个范围内取值的百分比.
4.茎叶图:
适用于样本中的数据较少的情况.其优点是
(1)没有原始数据的丢失,所有信息均可以从茎叶图中得到,并能展示数据的分布情况;
(2)便于记录和表示.缺点是当样本数据较多或数据位数较多时,就会显得不太方便.因为每一个数据都要在图中占据一定的空间,如果数据很多,枝叶就会很长.
二、用样本的数字特征估计总体的数字特征
1.众数:
若一组数据中有一个或几个数据出现得最多,且出现的次数一样,那么这些数据都是这组数据的众数,因此一组数据的众数可能不止一个.若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数.
2.中位数:
将一组数据按大小顺序依次排列,处在最中间位置的一个数据(或中间两个数据的平均数)是该组数据的中位数.
3.平均数:
与样本中的每一个数据都有关系,反映了更多关于数据总体的信息,比较可靠.但受极端值的影响较大.
4.极差:
就是一组数据中最大数与最小数的差.
5.方差:
用来刻画样本数据的波动情况,充分利用了所有的数据,但与原始数据的单位不一致.方差具有非负性.
6.标准差:
方差的算术平方根,与原数据的单位一致,且标准差也具有非负性.
三、数字特征在频率分布直方图中的体现
在频率分布直方图中,最高的小矩形的底边中点的横坐标即为样本数据的众数的估计值,中位数左边和右边的小矩形的面积和相等(注:
这样求出的中位数是近似值);
平均数的估计值等于频率分布直方图中每个小矩形的面积与其底边中点的横坐标的乘积之和.
四、特别提示
1.两类估计都具有随机性,得出的结论不一定是总体的真正的分布、均值或方差.样本质量的高低也是影响正确估计总体的重要因素.
2.应用茎叶图进行统计时,注意重复出现的数据要重复记录,不能遗漏.
3.样本水平的高低由其平均数决定,样本数据的稳定性与方差和标准差有关.在平均数相差不大的情况下,可以进一步借助方差或标准差来比较优劣.
4.方差越小,说明数据越稳定,但并不是方差越小越好.
5 近年高考统计图
一、频率分布直方图、频率分布折线图
例1 下表给出了从某校500名12岁男孩儿中用随机抽样得出的120人的身高.(单位:
cm)
区间界限
[122,126)
[126,130)
[130,134)
5
8
10
[134,138)
[138,142)
[142,146)
22
33
20
[146,150)
[150,154)
[154,158]
11
6
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)画出频率折线图;
(4)估计身高小于134cm的人数占总人数的百分比.
解
(1)样本的频率分布表如下:
分组
频数
频率
0.04
0.07
0.08
0.18
0.28
0.17
0.09
0.05
合计
120
1.00
(2)(3)频率分布直方图、频率折线图如下:
(4)由样本的频率分布表可知身高小于134cm的男孩儿出现的频率为0.04+0.07+0.08=0.19,所以估计身高小于134cm的人数占总人数的19%.
二、条形统计图
例2 A市某中学图书馆将图书分为自然科学、文学艺术、社会百科、数学四类.在“A市读书月”活动期间,为了解本校图书的借阅情况,图书管理员对本月各类图书的借阅量进行了统计,下表和下图是图书管理员通过采集数据后,绘制的不完整的频率分布表与频数分布条形图.请你根据图表中提供的信息,解答以下问题:
图书种类
自然科学
文学艺术
1000
0.50
社会百科
500
0.25
数学
100
(1)填充上表中的空格;
(2)在上图中,将表示“自然科学”的部分补充完整.
分析 可利用频率分布表的频率之和为1求频率,再根据比例关系求频数,根据这两个数据即可顺利补充完整题中的图表了.
解
(1)自然科学对应的频率为1-0.50-0.25-0.05=0.20,自然科学对应的频数为
×
0.20=400.
(2)补全的图形如图所示.
点评 补图(表)题是统计中的一种重点题型,解决这类题目可以根据已知条件,对照统计图(表)中的已知内容来明确所应补充的内容.
三、茎叶图
例3 如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人在这几场比赛中得分的中位数之和是________.
解析 将一组数据按从小到大的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数)为中位数,因而甲组的中位数是28,乙组的中位数是36.所以甲、乙两人这几场比赛得分的中位数之和是64.
答案 64
点评 制作茎叶图的方法是将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶同行列出.在求中位数时,首先要先进行数据的排序(从小到大),并注意总数据的个数为奇数还是偶数.
6 关注数字特征
众数、中位数、平均数都是描述一组数据集中趋势的量.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.若数据的平均数大于样本的中位数,说明数据中存在较大的极端值;
反之,说明数据中存在较小的极端值.
一组数据的离散程度可以用极差、方差或标准差来描述.极差反映了一组数据变化的幅度,但只涉及两个数据,不能提供确切的信息.方差和标准差均描述了一组数据围绕平均数波动的大小情况,即描述了数据对平均数的离散程度.样本方差或标准差越大,样本数据的稳定性就越差.
一、正确理解数字特征
例1某工厂工作人员的工资情况如下:
工作人员
经理
管理人员
技工
工人
学徒
周工资
2000
300
250
200
1
4
7
(1)指出这个问题中周工资的众数、中位数和平均数;
(2)在这个问题中,平均数、众数、中位数哪一个更能客观地反映该工厂工作人员的工资水平?
分析 该例着眼于众数、中位数、平均数各自的特点,以及其适用情况.
解
(1)由表格可知,众数为200元/周.因为周工资小于250元的有11人,大于250元的有5人,所以中位数为250元/周.平均数为(2000+300×
4+250×
7+200×
10+100)÷
23≈307(元/周).
(2)由表格中所列出的数据可见,只有经理的工资在平均数以上,其余人的工资都在平均数以下,故平均数不能客观真实地反映该工厂工作人员的工资水平.又因周工资大于200元的人员占总人数的一半还多,故中位数更客观.
点评 众数考查各数据出现的频率,大小只与这组数据中的部分数据有关.中位数和众数的优点是不受极端值的影响,缺点是可靠性比较差.平均数受数据中的极端值的影响较大,应用时要考虑是否存在极端值.
二、利用数字特征判优劣
例2甲、乙两位学生参加数学竞赛培训,在培训期间,他们参加的5次预赛成绩记录如下:
甲 82 82 79 95 87
乙 95 75 80 90 85
(1)用茎叶图表示这两组数据;
(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?
说明理由.
解
(1)作出茎叶图如图所示:
(2)
甲=
(70×
1+80×
3+90×
1+9+2+2+7+5)=85,
乙=
2+90×
2+5+0+5+0+5)=85,
s
=
[(79-85)2+(82-85)2+(82-85)2+(87-85)2+(95-85)2]=31.6,
[(75-85)2+(80-85)2+(85-85)2+(90-85)2+(95-85)2]=50.∵
乙,s
<
.
∴甲的成绩较稳定,派甲参赛比较合适.
点评 同样的数据,从不同的角度看会得出不同的结论.故在解决实际问题时,应根据具体情况合理选择数字特征.
7 学习变量的相关关系的注意点
一、相关关系不一定是因果关系
函数关系是一种因果关系,但相关关系不一定是因果关系,它仅是一种伴随关系.
例1下列各组关系中,不属于相关关系的是______.(填序号)
①农作物的产量与施肥量之间的关系;
②角的大小与所对的圆弧长之间的关系;
③红橙的产量与气候之间的关系;
④人的身高与体重之间的关系.
解析 角的大小与所对的圆弧长之间的关系是一种确定的函数关系.
答案 ②
二、注意区分回归方程中a,b的意义
回归方程为
=bx+a,其中b是回归系数,而一次函数的习惯写法为y=ax+b,不要把它们混淆了.另外,对于回归方程
=bx+a有a=
-b
,即
=b
+a.
例2一蚊香销售公司进行了一次市场调查,并统计了某品牌电热蚊香片的销售单价x(元/盒)与平均日销量y(盒),得到如下的数据资料:
x
12
17
25
y
50
42
18
9
若由相关资料知,y与x呈线性相关关系,试求y与x的回归方程.
解 由表中数据知
=16.8,
=29.8,
iyi=2099,
=1558,
∴b=
≈-2.75,
a=
=29.8+2.75×
16.8=76.
∴所求的回归方程为
=-2.75x+76.
点评 在写回归方程时,容易误写为
=76x-2.75,其原因是求出a,b后,把回归方程公式
=bx+a中的a,b位置搞错了.
三、注意建立回归方程的前提条件
当数据之间具有线性相关关系时才可以求回归方程.若数据之间不具有线性相关关系,即使用最小平方法求出了回归方程,其回归方程也是没有实际意义的,不能用来作为估计的根据.所以求回归方程前一定要判断两个变量是否线性相关.
例3下表给出了x,y之间的一组数据:
2
3
变量x,y之间是否具有相关关系?
若有,求出回归方程.
解 画出变量x,y的相关数据对应的散点图如图所示:
由散点图可以看出,各点并不在一条直线附近,所以变量x,y之间不具有线性相关关系,不能用回归直线进行拟合,即使用样本数据求得回归方程也是没有意义的.
点评 此题易产生如下错解,求得b=0,a=1.5,所以回归方程为
=1.5.产生错解的原因是没有考察变量x,y之间是否具有相关关系.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 培优导学计划高中数学 必修3 苏教版 第二章 疑难规律方法 培优导学 计划 高中数学 必修 第二 疑难 规律 方法
![提示](https://static.bdocx.com/images/bang_tan.gif)