推荐学习K12高考数学二轮复习 专题四 概率与统计 第1讲 统计与统计案例练习Word格式.docx
- 文档编号:13658088
- 上传时间:2022-10-12
- 格式:DOCX
- 页数:21
- 大小:272.36KB
推荐学习K12高考数学二轮复习 专题四 概率与统计 第1讲 统计与统计案例练习Word格式.docx
《推荐学习K12高考数学二轮复习 专题四 概率与统计 第1讲 统计与统计案例练习Word格式.docx》由会员分享,可在线阅读,更多相关《推荐学习K12高考数学二轮复习 专题四 概率与统计 第1讲 统计与统计案例练习Word格式.docx(21页珍藏版)》请在冰豆网上搜索。
解析 因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价.
答案 分层抽样
3.(2018·
全国Ⅱ卷)下图是某地区2000年至2016年环境基础设施投资额y(单位:
亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:
=-30.4+13.5t;
根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:
=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?
并说明理由.
解
(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=-30.4+13.5×
19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为
=99+17.5×
9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=
-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
考点整合
1.抽样方法
抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围.
2.统计中的四个数据特征
(1)众数:
在样本数据中,出现次数最多的那个数据.
(2)中位数:
样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
(3)平均数:
样本数据的算术平均数,即=(x1+x2+…+xn).
(4)方差与标准差.
s2=[(x1-)2+(x2-)2+…+(xn-)2],
s=.
3.直方图的两个结论
(1)小长方形的面积=组距×
=频率.
(2)各小长方形的面积之和等于1.
4.回归分析与独立性检验
(1)回归直线=x+经过样本点的中心点(,),若x取某一个值代入回归直线方程=x+中,可求出y的估计值.
(2)独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表是:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
a+c
b+d
n
则K2=(其中n=a+b+c+d为样本容量).
热点一 抽样方法
【例1】
(1)(2018·
合肥模拟)某校为了解学生学习的情况,采用分层抽样的方法从高一1000人、高二1200人、高三n人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n=( )
A.860B.720
C.1020D.1040
(2)(2018·
长沙雅礼中学质检)在一次马拉松比赛中,35名运动员的成绩(单位:
分钟)的茎叶图如图所示:
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.
解析
(1)依题意,分层抽样比为=.
∴81=(1000+1200+n),解得n=1040.
(2)依题意,可将编号为1~35号的35个数据分成7组,每组有5个数据.
在区间[139,151]上共有20个数据,分在4个小组内,每组抽取1人,共抽取4人.
答案
(1)D
(2)4
探究提高 1.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体容量的比值.
2.在系统抽样的过程中,要注意分段间隔,需要抽取n个个体,样本就需要分成n个组,则分段间隔即为(n为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.
【训练1】
(1)(2018·
郑州模拟)为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( )
A.13B.19C.20D.51
(2)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.
解析
(1)由系统抽样的原理知,抽样的间隔为52÷
4=13,故抽取的样本的编号分别为7,7+13,7+13×
2,7+13×
3,即7号,20号,33号,46号.
∴样本中还有一位同学的编号为20号.
(2)因为样本容量n=60,总体容量N=200+400+300+100=1000,所以抽取比例为==.
因此应从丙种型号的产品中抽取300×
=18(件).
答案
(1)C
(2)18
热点二 用样本估计总体
考法1 数字特征与茎叶图的应用
【例2-1】(2018·
北京东城区质检)某班男女生各10名同学最近一周平均每天的锻炼时间(单位:
分钟)用茎叶图记录如下:
假设每名同学最近一周平均每天的锻炼时间是互相独立的.
①男生每天锻炼的时间差别小,女生每天锻炼的时间差别大;
②从平均值分析,男生每天锻炼的时间比女生多;
③男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差;
④从10个男生中任选一人,平均每天的锻炼时间超过65分钟的概率比同样条件下女生锻炼时间超过65分钟的概率大.
其中符合茎叶图所给数据的结论是( )
A.①②③B.②③④C.①②④D.①③④
解析 由茎叶图知,男生每天锻炼时间差别小,女生差别大,①正确.
男生平均每天锻炼时间超过65分钟的概率P1==,女生平均每天锻炼时间超过65分钟的概率P2==,P1>
P2,因此④正确.
设男生、女生两组数据的平均数分别为甲,乙,标准差分别为s甲,s乙.
易求甲=65.2,乙=61.8,知甲>
乙,②正确.
又根据茎叶图,男生锻炼时间较集中,女生锻炼时间较分散,
∴s甲<
s乙,③错误,
因此符合茎叶图所给数据的结论是①②④.
答案 C
考法2 用样本的频率分布估计总体分布
【例2-2】(2017·
北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:
[20,30),[30,40),…[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
解
(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×
10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4.
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.
(2)根据题意,样本中分数不小于50的频率为
(0.01+0.02+0.04+0.02)×
10=0.9,
分数在区间[40,50)内的人数为100-100×
0.9-5=5.
所以总体中分数在区间[40,50)内的人数估计为400×
=20.
(3)由题意可知,样本中分数不小于70的学生人数为
(0.02+0.04)×
10×
100=60,
所以样本中分数不小于70的男生人数为60×
=30.
所以样本中的男生人数为30×
2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.
探究提高 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.
2.在本例2-2中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;
本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
【训练2】
(1)如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:
件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.3,5B.5,5
C.3,7D.5,7
解析 由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,所以y=5.由乙组数据59,61,67,65,78,可得乙组数据的平均值为66,故甲组数据的平均值也为66,从而有=66,解得x=3.
(2)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:
吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
①求直方图中a的值;
②设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;
③估计居民月均用水量的中位数.
解 ①由频率分布直方图可知:
月均用水量在[0,0.5)内的频率为0.08×
0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 推荐学习K12高考数学二轮复习 专题四 概率与统计 第1讲 统计与统计案例练习 推荐 学习 K12 高考 数学 二轮 复习 专题 概率 统计 案例 练习
链接地址:https://www.bdocx.com/doc/13658088.html