届高三数学一轮复习导学案教师讲义第11章第2讲 用样本估计总体.docx
- 文档编号:3748901
- 上传时间:2022-11-25
- 格式:DOCX
- 页数:23
- 大小:287.72KB
届高三数学一轮复习导学案教师讲义第11章第2讲 用样本估计总体.docx
《届高三数学一轮复习导学案教师讲义第11章第2讲 用样本估计总体.docx》由会员分享,可在线阅读,更多相关《届高三数学一轮复习导学案教师讲义第11章第2讲 用样本估计总体.docx(23页珍藏版)》请在冰豆网上搜索。
届高三数学一轮复习导学案教师讲义第11章第2讲用样本估计总体
第2讲 用样本估计总体
[学生用书P188]
1.统计图表
(1)频率分布直方图的画法步骤
①求极差(即一组数据中最大值与最小值的差);
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图.
(2)频率分布折线图和总体密度曲线
①频率分布折线图:
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
②总体密度曲线:
随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
(3)茎叶图的画法步骤
第一步:
将每个数据分为茎(高位)和叶(低位)两部分;
第二步:
将最小茎与最大茎之间的数按大小次序排成一列;
第三步:
将各个数据的叶依次写在其茎的两侧.
2.样本的数字特征
(1)众数:
一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:
把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:
把称为a1,a2,…,an这n个数的平均数.
(4)标准差与方差:
设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是
s=
s2=[(x1-)2+(x2-)2+…+(xn-)2]
3.标准差和方差的异同
相同点:
标准差和方差描述了一组数据围绕平均数波动的大小.
不同点:
方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差则不然.
判断正误(正确的打“√”,错误的打“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( )
(3)从频率分布直方图中得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )
(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( )
(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( )
答案:
(1)√
(2)× (3)√ (4)× (5)√ (6)×
(2017·高考全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:
kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数
解析:
选B.标准差能反映一组数据的稳定程度.故选B.
(教材习题改编)某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,中位数为b,众数为c,则有( )
A.a>b>cB.b>c>a
C.c>a>bD.c>b>a
解析:
选D.把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a=×(10+12+14+14+15+15+16+17+17+17)=14.7,中位数b==15,众数c=17,则a
某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.93B.123
C.137D.167
解析:
选C.初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1-60%)=60,该校女教师的人数为77+60=137,故选C.
有一个容量为66的样本,数据的分组及各组的频数如下:
2 4 9
18 11 12
7 3
根据样本的频率分布估计,数据落在的概率约是( )
A.B.
C.D.
解析:
选B.由条件可知,落在的数据有12+7+3=22,
故所求概率约为=.
某高校从参加今年自主招生考试的1000名学生中随机抽取100名学生的成绩进行统计,得到如图所示的样本频率分布直方图.若规定60分及以上为合格,则估计这1000名学生中合格的人数是( )
A.600B.650
C.700D.750
解析:
选C.样本中合格的频率是1-0.1-0.2=0.7,故估计这1000名学生中合格的人数是1000×0.7=700.故选C.
频率分布直方图(高频考点)
[学生用书P189]
频率分布直方图是高考的热点,选择题、填空题、解答题都有可能出现.难度一般较小.主要命题角度有:
(1)利用频率分布直方图求频率或频数;
(2)利用频率分布直方图求数字特征;
(3)利用频率分布直方图估计概率.
[典例引领]
角度一 利用频率分布直方图求频率或频数
(2017·高考北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:
[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
【解】
(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4.
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.
(2)根据题意,样本中分数不小于50的频率为
(0.01+0.02+0.04+0.02)×10=0.9,
分数在区间[40,50)内的人数为100-100×0.9-5=5.
所以总体中分数在区间[40,50)内的人数估计为400×=20.
(3)由题意可知,样本中分数不小于70的学生人数为
(0.02+0.04)×10×100=60,
所以样本中分数不小于70的男生人数为60×=30.
所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.
角度二 利用频率分布直方图求数字特征
(2018·武汉调考)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理制度,即确定一个合理的居民月用水量标准x(吨),用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解全市居民用水量的分布情况,通过抽样,获得了某年100位居民的月均用水量(单位:
吨),将数据按照[0,0.5],(0.5,1],…,(4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求a的值;
(2)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值;
(3)已知平价收费标准为4元/吨,议价收费标准为8元/吨.当x=3时,估计该市居民的月平均水费.(同一组中的数据用该组区间的中点值代替)
【解】
(1)由(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.
(2)因为前6组的频率之和是(0.08+0.16+0.30+0.40+0.52+0.30)×0.5=0.88>0.85,
前5组的频率之和为(0.08+0.16+0.30+0.40+0.52)×0.5=0.73<0.85,
所以2.5 由0.3×(x-2.5)=0.85-0.73,解得x=2.9. (3)设该市居民月均用水量为t吨,相应的水费为y元, 则y= 即y= 由题设条件及月均用水量的频率分布直方图,得居民每月的水费数据分组与频率分布表如下: 组号 1 2 3 4 5 6 7 8 9 分组 [0,2] (2,4] (4,6] (6,8] (8,10] (10,12] (12,16] (16,20] (20,24] 频率 0.04 0.08 0.15 0.20 0.26 0.15 0.06 0.04 0.02 根据题意,估计该市居民的月平均水费为 1×0.04+3×0.08+5×0.15+7×0.20+9×0.26+11×0.15+14×0.06+18×0.04+22×0.02=8.42(元). 角度三 利用频率分布直方图估计概率 某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表. B地区用户满意度评分的频数分布表 满意度评 分分组 [50,60) [60,70) [70,80) [80,90) [90,100] 频数 2 8 14 10 6 (1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可). (2)根据用户满意度评分,将用户的满意度分为三个等级: 满意度评分 低于70分 70分到89分 不低于90分 满意度等级 不满意 满意 非常满意 估计哪个地区用户的满意度等级为不满意的概率大? 说明理由. 【解】 (1)如图所示. 通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散. (2)A地区用户的满意度等级为不满意的概率大. 记CA表示事件: “A地区用户的满意度等级为不满意”;CB表示事件: “B地区用户的满意度等级为不满意”.由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,P(CB)的估计值为(0.005+0.02)×10=0.25. 所以A地区用户的满意度等级为不满意的概率大. 解决频率分布直方图问题的要点 (1)直方图中各小长方形的面积之和为1. (2)直方图中纵轴表示,故每组样本的频率为组距×,即小长方形的面积. (3)直方图中每组样本的频数为频率×总体个数. [通关练习] (2018·广西三市第一次联考)一企业从某条生产线上随机抽取100件产品,测量这些产品的某项技术指标值x,得到如下的频率分布表: x [11,13) [13,15) [15,17) [17,19) [19,21) [21,23] 频数 2 12 34 38 10 4 (1)作出样本的频率分布直方图,并估计该技术指标值x的平均数和众数; (2)若x<13或x≥21,则该产品不合格.现从不合格的产品中随机抽取2件,求抽取的2件产品中技术指标值小于13的产品恰有1件的概率. 解: (1)频率分布直方图如图: 估计平均数为=12×0.02+14×0.12+16×0.34+18×0.38+20×0.10+22×0.04=17.08. 估计众数为18. (2)记技术指标值x<13的2件不合格产品为a1,a2,技术指标值x≥21的4件不合格产品为b1,b2,b3,b4,则从这6件不合格产品中随机抽取2件包含以下基本事件(a1,a2),(a1,b1),(a1,b2),(a1,b3),(a1,b4),(a2,b1),(a2,b2),(a2,b3),(a2,b4),(b1,b2),(b1,b3),(b1,b4),(b2,b3),(b2,b4),(b3,b4),共15个基本事件. 记抽取的2件产品中技术指标值小于13的产品恰有1件为事件M,则事件M包含如下基本事件(a1,b1),(a1,b2),(a1,b3),(a1,b4),(a2,b1),(a2,b2),(a2,b3),(a2,b4),共8个基本事件. 故抽取的2件产品中技术指标值小于13的产品恰有1件的概率为P=. 茎叶图[学生用书P190] [典例引领] (1)为了了解某校教师使用多媒体进行教学的情况,现采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.据此可估计上学期该校400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为( ) A.100 B.160 C.200D.280 (2)(2017·高考山东卷)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位: 件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( ) A.3,5B.5,5 C.3,7D.5,7 【解析】 (1)由茎叶图可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为400×=160. (2)根据两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等, 所以 =, 解得x=3.故选A. 【答案】 (1)B (2)A 茎叶图中的三个关注点 (1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一. (2)重复出现的数据要重复记录,不能遗漏. (3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小. [通关练习] 1.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( ) 解析: 选A.由已知得,共分为8组,选项C、D不符合题意,应排除; 由茎叶图知[0,5)的频数为1,==0.01, [5,10)的频数为1,==0.01, [10,15)的频数为4,==0.04, …, 由以上计算可知,选项B不符合题意. 2.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位: h).试验的观测结果如下: 服用A药的20位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5 (1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好? 解: (1)设A药观测数据的平均数为,B药观测数据的平均数为. 由观测结果可得 =(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3, =(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6. 由以上计算结果可得>,因此可看出A药的疗效更好. (2)由观测结果可绘制茎叶图如图: 从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎“2.”,“3.”上,而B药疗效的试验结果有的叶集中在茎“2.”,“3.”上,由此可看出A药的疗效更好. 样本的数字特征(高频考点) [学生用书P191] 样本的数字特征是每年高考的重点,且多与频率分布直方图、茎叶图相结合考查.主要命题角度有: (1)数字特征的计算; (2)用样本的数字特征解决生活中的优化问题. [典例引领] 角度一 数字特征的计算 某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分如图所示,假设得分值的中位数为me,平均值为,众数为mo,则( ) A.me=mo= B.me=mo< C.me 【解析】 由题图知mo=5. 由中位数的定义知me应该是第15个数与第16个数的平均值,由图知将数据从小到大排,第15个数是5,第16个数是6,所以me==5.5. =≈5.97>5.5,所以mo 【答案】 D 角度二 用样本的数字特征解决生活中的优化问题 (2016·高考全国卷Ⅰ)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图: 记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位: 元),n表示购机的同时购买的易损零件数. (1)若n=19,求y与x的函数解析式; (2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值; (3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件? 【解】 (1)当x≤19时,y=3800; 当x>19时,y=3800+500(x-19)=500x-5700. 所以y与x的函数解析式为 y=(x∈N). (2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19. (3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3800,20台的费用为4300,10台的费用为4800,因此这100台机器在购买易损零件上所需费用的平均数为 ×(3800×70+4300×20+4800×10)=4000.若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4000,10台的费用为4500,因此这100台机器在购买易损零件上所需费用的平均数为 ×(4000×90+4500×10)=4050. 比较两个平均数可知,购买1台机器的同时应购买19个易损零件. (1)利用频率分布直方图估计样本的数字特征的方法 ①中位数: 在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值. ②平均数: 平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和. ③众数: 最高的矩形的中点的横坐标. (2)样本数字特征及公式推广 ①平均数和方差都是重要的数字特征,是对总体的一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小. ②平均数、方差公式的推广 若数据x1,x2,…,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m+a,方差为m2s2. [通关练习] 1.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位: ℃)制成如图所示的茎叶图.考虑以下结论: ①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A.①③B.①④ C.②③D.②④ 解析: 选B.甲地该月14时的气温数据分布在26和31之间,且数据波动较大,而乙地该月14时的气温数据分布在28和32之间,且数据波动较小,可以判断结论①④正确,故选B. 2.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________. 解析: 已知样本数据x1,x2,…,x10的标准差为s=8,则s2=64,数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为=2×8=16. 答案: 16 3.某城市100户居民的月平均用电量(单位: 度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图. (1)求直方图中x的值; (2)求月平均用电量的众数和中位数. 解: (1)由(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1得x=0.0075, 所以直方图中x的值为0.0075. (2)月平均用电量的众数是=230. 因为(0.002+0.0095+0.011)×20=0.45<0.5, (0.002+0.0095+0.011+0.0125)×20=0.7>0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a,则(0.002+0.0095+0.011)×20+0.0125×(a-220)=0.5,解得a=224,即中位数为224. 众数、中位数、平均数、方差 (1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质. (2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大. 直方图与条形图的区别 条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)是固定的;直方图是用面积表示各组频率的多少,矩形的高度表示每一组的频率除以组距,宽度则表示各组的组距,因此其高度与宽度均有意义. [学生用书P335(单独成册)] 1.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位: 万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是( ) A.月接待游客量逐月增加 B.年接待游客量逐年增加 C.各年的月接待游客量高峰期大致在7,8月 D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 解析: 选A.由折线图可知,各年的月接待游客量从8月份后存在下降趋势,故选A. 2.已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 届高三数学一轮复习导学案教师讲义第11章第2讲 用样本估计总体 届高三 数学 一轮 复习 导学案 教师 讲义 11 样本 估计 总体