届高考数学大二轮复习专题六概率与统计第1讲统计统计案例练习文文档格式.docx
- 文档编号:22364769
- 上传时间:2023-02-03
- 格式:DOCX
- 页数:34
- 大小:212.40KB
届高考数学大二轮复习专题六概率与统计第1讲统计统计案例练习文文档格式.docx
《届高考数学大二轮复习专题六概率与统计第1讲统计统计案例练习文文档格式.docx》由会员分享,可在线阅读,更多相关《届高考数学大二轮复习专题六概率与统计第1讲统计统计案例练习文文档格式.docx(34页珍藏版)》请在冰豆网上搜索。
之比依次为2:
3:
4,为检验该公司的产品质量,用分层抽样的方法抽取一个容量为n的样本,
若样本中A种型号的轿车比B种型号的轿车少8辆,则n=()
A.96B.72
C.48D.36
答案B
23
解析由题意,得§
n—9门=—8,•n=72.选B.
系统抽样与分层抽样的求解方法
(1)系统抽样的最基本特征是“等距性”,每组内所抽取的号码需要依据第一组抽取的号
码和组距唯一确定.每组抽取样本的号码依次构成一个以第一组抽取的号码m为首项,组距d
为公差的等差数列{an},第k组抽取样本的号码ak=m^(k—1)d.
(2)分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,求解此类问题
需先求出抽样比一一样本容量与总体容量的比,则各层所抽取的样本容量等于该层个体总数
与抽样比的乘积•在每层抽样时,应采用简单随机抽样或系统抽样进行.
1.(2019•云南省第二次高三统一检测)某中学高一年级有学生1200人,高二年级有学
生900人,高三年级有学生1500人,现按年级为标准,用分层抽样的方法从这三个年级学生
中抽取一个容量为720的样本进行某项研究,则应从高三年级学生中抽取学生()
A.200人B.300人
C.320人D.350人
解析由分层抽样可得高三抽取的学生人数为120。
+go。
*150。
%720=3。
。
.故选B
2.采用系统抽样方法从96。
人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,
96。
,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入
[1,45。
]的人做问卷代编号落入[451,75。
]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为.
答案10
B的人数为10.
117
451<
9+30k<
750(k€N),得14<
k<
24,所以做问卷
1510
考向2用样本估计总体
例2
(1)甲、乙两名学生在5次数学考试中的成绩统计如茎叶图所示,若x甲,x乙分别
表示甲、乙两人的平均成绩,则下列结论正确的是()
A.x甲>x乙,乙比甲稳定
B.
X甲〉X乙,甲比乙稳定
C.壬甲<亍乙,乙比甲稳定
D.
X甲<X乙,甲比乙稳定
答案A
―1
解析因为X甲=5X(74+82+88+91+95)=86,x乙=5X(77+77+78+86+92)=82,
__11
所以壬甲>x乙因为s*=—X[(—12)2+(—4)2+22+52+92]=54,s;
=—X[(—5)2+(—5)2+(—
55
4)2+42+102]=36.4,所以s甲>sl,故乙比甲稳定.故选A.
(2)(2019•皖南八校高三第三次联考)从某地区年龄在25〜55岁的人员中,随机抽出100
人,了解他们对今年两会的热点问题的看法,绘制出频率分布直方图如图所示,则下列说法正确的是()
解析根据频率分布直方图的性质得(0.01+0.05+0.06+a+0.02+0.02)X5=1,解得
a=0.04,所以抽出的100人中,年龄在40〜45岁的人数大约为0.04X5X100=20,所以A
正确;
年龄在35〜45岁的人数大约为(0.06+0.04)X5X100=50,所以B不正确;
年龄在40〜
50岁的人数大约为(0.04+0.02)X5X100=30,所以C不正确;
年龄在35〜50岁的人数大约
为(0.06+0.04+0.02)X5X100=60,所以D不正确.故选A.
(1)频率分布直方图中每个小矩形的面积为对应的频率,不要混淆频率分布条形图和频率
分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
(2)由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表题时,就要充
分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断.
1.(2019•福建省高三模拟)为比较甲、乙两名高二学生的数学素养,对课程标准中规定
的数学六大素养进行指标测验(指标值满分为5分,分值高者为优),根据测验情况绘制了如
图所示的六大素养指标雷达图,则下面叙述正确的是()
A.乙的数据分析素养优于甲
B.乙的数学建模素养优于数学抽象素养
C.甲的六大素养整体水平优于乙
D.甲的六大素养中数据分析最差
解析根据雷达图得到如下数据所示.
数学抽象
逻辑
推理
r数学
建模
直观
想象
数学
运算
数据
分析
甲
4
5
丄
乙
3
_41
由数据可知选C.
2.(2019•江西省吉安一中、九江一中、新余一中等八所重点中学高三4月联考)某地区
某村的前三年的经济收入分别为100,200,300万元,其统计数据的中位数为X,平均数为y;
经过今年政府新农村建设后,该村经济收入在上年基础上翻番,则在这4年里收入的统计数
据中,下列说法正确的是()
A.中位数为x,平均数为1.5y
B.中位数为1.25x,平均数为y
C.中位数为1.25x,平均数为1.5y
D.
中位数为1.5x,平均数为2y答案C
E.
(1)令z=Inx,由散点图判断y=bx+a与y=bz+a哪个更合适于此模型(给出判断即可,
365•入住率•收费标准x)
66
....25
刀yiZi~12.7,刀zi~158.1,e~148.4.
i=1i=17
解
(1)由散点图可知y=bz+a更适合于此模型.
6
ai斗zy—6zy—1.07a—a—
其中b=~6=~—0.5,a=y—bz=3,
2小—22.04
K戶―6z
所求的回归方程为y=—0.5lnx+3.
365
(2)L=365(—0.5lnx+3)x=xlnx+1095x.
365365人,5
L=—~2~Inx2_~365x3,令L=0?
Inx=5?
x=e疋148.4.
•••若一年按365天计算,当收费标准约为148.4元/日时,年销售额L最大,最大值约为
27083元.
在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.
(2019•太原市高三模拟)近年来随着互联网的高速发展,旧货交易市场也得以快速发
展•某网络旧货交易平台对2018年某种机械设备的线上交易进行了统计,得到如图所示的频
率分布直方图和散点图•现把直方图中各组的频率视为概率,用x(单位:
年)表示该设备的使
用时间,y(单位:
万元)表示其相应的平均交易价格.
(1)已知2018年在此网络旧货交易平台成交的该种机械设备为100台,现从这100台设
备中,按分层抽样抽取使用时间x€(12,20]的4台设备,再从这4台设备中随机抽取2台,
求这2台设备的使用时间都在(12,16]的概率;
(2)由散点图分析后,可用y=ebx+a作为此网络旧货交易平台上该种机械设备的平均交易
价格y关于其使用时间x的回归方程.
X
—
10
Xiyi
i=1
XiZi
2
Xi
5.5
8.7
1.9
301.4
79.75
385
1根据上述相关数据,求y关于x的回归方程;
2根据上述回归方程,求当使用时间x=15时,该种机械设备的平均交易价格的预报值
(精确到0.01).
附:
对于一组数据(U1,V1),(U2,V2),…,(Un,Vn),其回归直线V=%+®
U的斜率和
UiVi—nuv
Ai—1人人
截距的最小二乘估计分别为卩=,a=V—3U.
2一2
」一nu
参考数据:
e0'
55=1.733,e—0.95=0.3867,e—185=0.1572.
解
(1)由图1中频率分布直方图可知,从2018年成交的该种机械设备中使用时间x€
(12,16]的台数为100X4X0.03=12,使用时间x€(16,20]的台数为100X4X0.01=4,
•••按分层抽样所抽取4台中,使用时间x€(12,16]的设备有3台,分别记为A,B,C;
使用时间x€(16,20]的设备有1台,记为d,
•从这4台设备中随机抽取2台的结果为(A,B),(A,C),(A,d),(B,C,(B,d),
(C,d),共有6种等可能出现的结果,其中这2台设备的使用时间x都在(12,16]的结果为(A,
31
B),(AC,(B,C),共有3种,所求事件的概率为.
62
XiZi—10xz
0.3,
⑵①由题意得z=lny=lnebx+a=bx+a,
79.75—10X5.5X1.9
385—10X5.5
Xi—10x
a=z—bx=1.9+0.3X5.5=3.55,
•z关于x的线性回归方程为z=—0.3x+3.55,
②由①知,当使用时间x=15时,y=e—0.3X15+3.55-0.39,故该种机械设备的平均交易价
格的预报值为0.39万元.
角度2独立性检验在实际中的应用
例4(2019•贵州遵义航天高级中学七模)某中学为了解中学生的课外阅读时间,决定
在该中学的1200名男生和800名女生中按分层抽样的方法抽取20名学生,对他们的课外阅
读时间进行问卷调查•现在按课外阅读时间的情况将学生分成三类:
A类(不参加课外阅读),
B类(参加课外阅读,但平均每周参加课外阅读的时间不超过3小时),C类(参加课外阅读,
且平均每周参加课外阅读的时间超过3小时).调查结果如下表:
A类
B类
C类
男生
x
女生
y
(1)求出表中x,y的值;
(2)根据表中的统计数据,完成下面的列联表,并判断是否有90%的把握认为“参加课外
(3)
阅读与否与性别有关”.
总计
不参加课外阅读
参加课外阅读
b+d,n=a+b+e+d.
RK?
>
ko)
0.10
0.05
0.01
ko
2.706
3.841
6.635
所以x=12—5—3=4,y=8—3—3=2.
20X4X6—2X8
12X8X14X6
h0.159<
2706,
(2)列联表如下:
8
14
12
20
所以没有90%的把握认为“参加阅读与否”与性别有关.
独立性检验的关键
(1)根据2X2列联表准确计算K2,若2X2列联表没有列出来,要先列出此表.
(2)K2的观测值k越大,对应假设事件H)成立的概率越小,H不成立的概率越大.
(2019•西安地区陕师大附中、西安高级中学等八校联考)西安市自2017年5月启动对
“车不让人行为”处罚以来,斑马线前机动车抢行不文明行为得以根本改变,斑马线前礼让行人也成为了一张新的西安“名片”.
但作为交通重要参与者的行人,闯红灯通行却频有发生,带来了较大的交通安全隐患及机动车通畅率降低,交警部门在某十字路口根据以往的检测数据,得到行人闯红灯的概率约为0.4,并从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯情况得到
2X2列联表如下:
30岁以下
30岁以上
合计
闯红灯
60
未闯红灯
80
200
近期,为了整顿“行人闯红灯”这一项不文明及违法行为,交警部门在该十字路口试行
了对闯红灯行人进行经济处罚,并从试行经济处罚后穿越该路口行人中随机抽取了200人进
行调查,得到下表:
处罚金额x(单位:
元)
15
闯红灯的人数y
50
40
将统计数据所得频率代替概率,完成下列问题.
(1)将2X2列联表填写完整(不需写出填写过程),并根据表中数据分析,在未试行对闯
红灯行人进行经济处罚前,是否有99.9%的把握认为闯红灯与年龄有关;
⑵当处罚金额为10元时,行人闯红灯的概率会比不进行处罚降低多少;
(3)结合调查结果,谈谈如何治理行人闯红灯现象.
参考公式:
2nad—be2»
亠
Qa+be+da+eb+d,其中n=a+b+e+"
参考数据:
RK2>
ko
)
0.25
0.15
0.025
0.010
0.005
0.001
k。
1.132
2.072
5.024
7.879
10.828
120
100
•••有99.9%的把握认为闯红灯与年龄有关.
(2)T未进行处罚前,行人闯红灯的概率为0.4,
401
进行处罚10元后,行人闯红灯的概率为200=5=0.2,
•降低了0.2.
(3)①根据调查数据显示,行人闯红灯与年龄有明显关系,可以针对30岁以上人群开展
“道路安全”宣传教育;
②由于处罚可以明显降低行人闯红灯的概率,可以进行适当处罚来
降低行人闯红灯的概率.
真题押题
『真题模拟』
万元*由万冗PI1K7JJL<4)1077元削2万元
丙
1.(2019•益阳市高三模拟)如图所示的三个统计图分别是随机抽查甲、乙、丙三地的若干个家庭教育年投入(万元),记A表示众数,B表示中位数,C表示平均数,则根据图表提供的信息,下面的结论正确的是()
A.A甲=A乙=A丙,B甲=B乙=B丙
B.B丙>B甲=B乙,C甲=C乙=C丙
C.A丙>A甲=A乙,C丙>C甲>C乙
D.A丙>A甲=A乙,B丙>B甲>B乙
解析由甲地的条形图可知,家庭教育年投入的中位数为10,众数为10,平均数为10.32;
由乙地的折线图可知,家庭教育年投入的中位数为10,众数为10,平均数为9.7;
由丙地的
扇形图可知,家庭教育年投入的中位数为12,众数为12,平均数为12.4.结合选项可知C正
确.故选C.
2.(2019•全国卷H)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()
A.中位数B.平均数
C.方差D.极差
解析中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.
3.(2019•郴州市高三第三次质量检测)新闻出版业不断推进供给侧结构性改革,深入推
动优化升级和融合发展,持续提高优质出版产品供给,实现了行业的良性发展.下面是2012
年至2016年我国新闻出版业和数字出版业营收增长情况:
给出下列四个结论:
12012年至2016年我国新闻出版业和数字出版业营收均逐年增加
22016年我国数字出版业营收超过2012年我国数字出版业营收的2倍
32016年我国新闻出版业营收超过2012年我国新闻出版业营收的1.5倍
42016年我国数字出版业营收占新闻出版业营收的比例未超过三分之一
其中所有正确结论的编号为()
A.①②B.①②③
C.①②④D.②③④
解析根据图示数据可知①正确;
对于②:
1935.5X2=3871<
5720.9,正确;
对于③:
1
16635.3X1.5>
23595.8,不正确;
对于④:
23595.8X7865>
5720.9,正确.故选C.
4.
,则该组数据的方差是
(2019•江苏高考)已知一组数据6,7,8,8,9,10
+(9—8)+(10—8)]=3
5.(2019•全国卷川)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:
将
200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服
乙离子溶液•每只小鼠给服的溶液体积相同、摩尔浓度相同•经过一段时间后用某种科学方
法测算出残留在小鼠体内离子的百分比•根据试验数据分别得到如下直方图:
记C为事件:
“乙离子残留在体内的百分比不低于5.5”,根据直方图得到F(C)的估计
值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代
表).
解
(1)由已知得0.70=a+0.20+0.15,故a=0.35.
b=1—0.05—0.15—0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2X0.15+3X0.20+4X0.30+5X0.20+6X0.10+7X0.05=4.05,
乙离子残留百分比的平均值的估计值为
3X0.05+4X0.10+5X0.15+6X0.35+7X0.20+8X0.15=6.00.
6.(2019•湖北武汉高三第二次质量检测)光伏发电是利用太阳能电池及相关设备将太阳
光能直接转化为电能•近几年在国内出台的光伏发电补贴政策的引导下,某地光伏发电装机量急剧上涨,如下表:
年份
2011
年
2012
2013
2014
2015
.年
2016
2017
2018
年份代码攵
7
新增光伏装机量y兆瓦
0.1
1.6
出1
5.1
7.1
9.7
12.2
某位同学分别用两种模型:
①y=bx2+a,②y=dx+c进行拟合,得到相应的回归方程并
进行残差分析,残差图如下(注:
残差等于yi—yi):
经过计算得(Xi—x)(yi—y)=72.8,(Xi-x)2=42,(ti-t)(yi—y)=
i=1i=1i=1
818
22
686.8,(ti—t)=3570,其中ti=Xi,t=8ti.
i=18i=1
(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?
并简要说明理由;
(2)根据
(1)的判断结果及表中数据建立y关于x的回归方程,并预测该地区2020年新增
光伏装机量是多少?
(在计算回归系数时精确到0.01)
回归直线的斜率和截距的最小二乘估计公式分别为
b=,a=y—bx.
—2
Xi—X
解
(1)选择模型①.
理由如下:
根据残差图可以看出,模型①的估计值和真实值比较相近,模型②的残差值相对较大一些,所以模型①的拟合效果相对较好.
AAAAAA
..22
(2)由
(1)可知,y关于x的回归方程为y=bX+a,令t=x,则y=bt+a.
181
由所给数据可得t=ti=X(1+4+9+16+25+36+49+64)=25.5.
8i=18
_181A
y=yi=X(0.4+0.8+1.6+3.1+5.1+7.1+9.7+12.2)=5,/•b=88
686.8
3570
〜0.19,
ti—t
a=y—bt〜5—0.19X25.5〜0.16,所以y关于x的回归方程为y=
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高考 数学 二轮 复习 专题 概率 统计 案例 练习