922 总体百分位数的估计.docx
- 文档编号:3305623
- 上传时间:2022-11-21
- 格式:DOCX
- 页数:17
- 大小:179.23KB
922 总体百分位数的估计.docx
《922 总体百分位数的估计.docx》由会员分享,可在线阅读,更多相关《922 总体百分位数的估计.docx(17页珍藏版)》请在冰豆网上搜索。
922总体百分位数的估计
9.2.2 总体百分位数的估计
课标要求
素养要求
结合实例,能用样本估计百分位数,理解百分位数的统计含义.
在学习和应用百分位数的过程中,要把实际问题转化为数学问题,并进行计算,对数据进行分析,发展学生的数学建模、数学运算素养和数据分析素养.
教材知识探究
某省数学考试结果揭晓,根据规定,0.8%的同学需要补考.
问题 那么如何确定需要补考的分数线呢?
提示 利用百分位数计算.
1.第p百分位数的定义
第50百分位数就是中位数,中位数是百分位数的特例,百分位数是中位数的推广
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.四分位数
25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.
教材拓展补遗
[微判断]
1.若一组样本数据各不相等,则其75%分位数大于25%分位数.(√)
2.若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.(×)
3.若一组样本数据的24%分位数是24,则在这组数据中至少有76%的数据大于或等于24.(√)
提示 2.若一组样本数据的10%分位数是23,则在这组数据中有10%的数据小于或等于23.
[微训练]
1.下列一组数据的第25百分位数是( )
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2B.3.0C.4.4D.2.5
解析 把该组数据按照由小到大排列,可得:
2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,
由i=10×25%=2.5,不是整数,则第3个数据3.2,是第25百分位数.
答案 A
2.下列关于一组数据的第50百分位数的说法正确的是( )
A.第50百分位数就是中位数
B.总体数据中的任意一个数小于它的可能性一定是50%
C.它一定是这组数据中的一个数据
D.它适用于总体是离散型的数据
解析 由百分位数的意义可知选项B,C,D错误.
答案 A
[微思考]
1.班级人数为50的班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?
提示 不是.是指能够考取本科院校的同学占同学总数的百分比.
2.“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?
提示 有70%的同学数学测试成绩小于或等于85分.
题型一 百分位数的计算
【例1】 从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:
g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,50,95百分位数;
(2)请你找出珍珠质量较小的前15%的珍珠质量;
(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.
解
(1)将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,
所以12×25%=3,12×50%=6,12×95%=11.4,
则第25百分位数是
=8.15,
第50百分位数是
=8.5,
第95百分位数是第12个数据为9.9.
(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.
即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.
(3)由
(1)可知样本数据的第25百分位数是8.15g,第50百分位数为8.5g,第95百分位数是9.9g,所以质量小于或等于8.15g的珍珠为次品,质量大于8.15g且小于或等于8.5g的珍珠为合格品,质量大于8.5g且小于或等于9.9g的珍珠为优等品,质量大于9.9g的珍珠为特优品.
规律方法 计算一组n个数据的第p百分位数的一般步骤:
(1)排列:
按照从小到大排列原始数据;
(2)算i:
计算i=n×p%;
(3)定数:
若i不是整数,大于i的最小整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
【训练1】 如图所示是某市3月1日至3月10日的最低气温(单位:
℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80百分位数是( )
A.-2B.0C.1D.2
解析 由折线图可知,这10天的最低气温按照从小到大的排列为:
-3,-2,-1,-1,0,0,1,2,2,2,
因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的第80百分位数是
=2.
答案 D
题型二 百分位数的综合应用
【探究1】 第p百分位数有什么特点?
提示 总体数据中的任意一个数小于或等于它的可能性是p%.
【探究2】 某组数据的第p百分位数在此组数据中一定存在吗?
为什么?
提示 不一定.因为按照计算第p百分位数的步骤,第2步计算所得的i=n×p%如果是整数,则第p百分位数为第i项与第(i+1)项数据的平均数,若第i项与第(i+1)项数据不相等,则第p百分位数在此组数据中就不存在.
【探究3】 某市为了鼓励居民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.
(1)求某户居民用电费用y(单位:
元)关于月用电量x(单位:
千瓦时)的函数解析式;
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用低于260元的占80%,求a,b的值;
(3)根据
(2)中求得的数据计算用电量的75%分位数.
解
(1)当0≤x≤200时,y=0.5x;
当200 y=0.5×200+0.8×(x-200)=0.8x-60; 当x>400时, y=0.5×200+0.8×200+1.0×(x-400)=x-140. 所以y与x之间的函数解析式为 y= (2)由 (1)可知,当y=260时,x=400,即用电量低于400千瓦时的占80%, 结合频率分布直方图可知 解得a=0.0015,b=0.0020. (3)设75%分位数为m, 因为用电量低于300千瓦时的所占比例为 (0.001+0.002+0.003)×100=60%, 用电量低于400千瓦时的占80%, 所以75%分位数m在[300,400)内, 所以0.6+(m-300)×0.002=0.75, 解得m=375(千瓦时),即用电量的75%分位数为375千瓦时. 规律方法 由频率分布直方图求百分位数的方法 (1)要注意频率分布直方图中小矩形的面积,就是数据落在该组的频率. (2)一般采用方程的思想,设出第p百分位数,根据其意义列出方程并求解即可. 【训练2】 某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组(第一组: [20,25),第二组: [25,30),第三组: [30,35),第四组: [35,40),第五组: [40,45]),得到如图所示的频率分布直方图,已知第一组有5人. (1)求x; (2)求抽取的x人的年龄的50%分位数(结果保留整数); (3)以下是参赛的10人的成绩: 90,96,97,95,92,92,98,88,96,99,求这10人成绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“一带一路”的认知程度,并谈谈你的感想. 解 (1)第一组频率为0.01×5=0.05, 所以x= =100. (2)由图可知年龄低于30岁的所占比例为40%,年龄低于35岁的所占比例为70%,所以抽取的x人的年龄的50%分位数在[30,35)内,由30+5× = ≈32,所以抽取的x人的年龄的50%分位数为32. (3)把参赛的10人的成绩按从小到大的顺序排列: 88,90,92,92,95,96,96,97,98,99, 计算10×20%=2,所以这10人成绩的20%分位数为 =91,这10人成绩的平均数为 (88+90+92+92+95+96+96+97+98+99)=94.3. 评价: 从第20百分位数和平均数来看,参赛人员的认知程度很高. 感想: 结合本题和实际,符合社会主义核心价值观即可. 一、素养落地 1.通过学习和应用百分位数,重点培养数据分析素养、数学运算和数学建模素养. 2.求一组数据的百分位数时,掌握其步骤: ①按照从小到大排列原始数据;②计算i=n×p%;③若i不是整数,大于i的最小整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数. 二、素养训练 1.已知100个数据的第75百分位数是9.3,则下列说法正确的是( ) A.这100个数据中一定有75个数小于或等于9.3 B.把这100个数据从小到大排列后,9.3是第75个数据 C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数 D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数 解析 因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,选C. 答案 C 2.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的第30百分位数是________. 解析 因为8×30%=2.4,故30%分位数是第三项数据8.4. 答案 8.4 3.一组样本数据的频率分布直方图如图所示,试估计此样本数据的第50百分位数为________. 解析 样本数据低于10的比例为(0.08+0.02)×4=0.40,样本数据低于14的比例为0.40+0.09×4=0.76,所以此样本数据的第50百分位数在[10,14)内,估计此样本数据的第50百分位数为10+ ×4= . 答案 4.求下列数据的四分位数. 13,15,12,27,22,24,28,30,31,18,19,20, 解 把12个数据按从小到大的顺序排列可得: 12,13,15,18,19,20,22,24,27,28,30,31, 计算12×25%=3,12×50%=6,12×75%=9, 所以数据的第25百分位数为 =16.5, 第50百分位数为 =21, 第75百分位数为 =27.5. 基础达标 一、选择题 1.数据12,14,15,17,19,23,27,30的第70百分位数是( ) A.14B.17C.19D.23 解析 因为8×70%=5.6,故70%分位数是第六项数据23. 答案 D 2.以下数据为参加数学竞赛决赛的15人的成绩: (单位: 分) 78,70,72,86,88,79,80,81,94,84,56,98,83,90,91, 则这15人成绩的第80百分位数是( ) A.90B.90.5C.91D.91.5 解析 把成绩按从小到大的顺序排列为: 56,70,72,78,79,80,81,83,84,86,88,90,91,94,98, 因为15×80%=12,所以这15人成绩的第80百分位数是 =90.5. 答案 B 3.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示.估计棉花纤维的长度的样本数据的80%分位数是( ) A.29mmB.29.5mm C.30mmD.30.5mm 解析 棉花纤维的长度在30mm以下的比例为 (0.01+0.01+0.04+0.06+0.05)×5=0.85=85%, 在25mm以下的比例为85%-25%=60%, 因此,80%分位数一定位于[25,30)内, 由25+5× =29, 可以估计棉花纤维的长度的样本数据的80%分位数是29mm. 答案 A 4.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,第50百分位数为b,则有( ) A.a=13.7,b=15.5B.a=14,b=15 C.a=12,b=15.5D.a=14.7,b=15 解析 把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a= ×(10+12+14+14+15+15+16+17+17+17)=14.7,因为10×50%=5,所以这10名工人一小时内生产零件的第50百分位数为b= =15. 答案 D 5.已知甲、乙两组数据(已按从小到大的顺序排列): 甲组: 27,28,39,40,m,50; 乙组: 24,n,34,43,48,52; 若这两组数据的第30百分位数、第80百分位数分别相等,则 等于( ) A. B. C. D. 解析 因为30%×6=1.8,80%×6=4.8,所以第30百分位数为n=28,第80百分位数为m=48,所以 = = . 答案 A 二、填空题 6.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的第________百分位数. 解析 因为分数位于[20,40),[40,60)的频率之和为(0.005+0.01)×20=0.3,所以60分为成绩的第30百分位数. 答案 30 7.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组: [13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70%分位数约为________秒. 解析 成绩的70%分位数为x,因为 =0.55, =0.85,所以x∈[16,17), 所以0.55+(x-16)× =0.70,解得x=16.5(秒). 答案 16.5 8.已知30个数据的第60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是______. 解析 由于30×60%=18,设第19个数据为x,则 =8.2,解得x=8.6,即第19个数据是8.6. 答案 8.6 三、解答题 9.如图是某市2019年4月1日至4月7日每天最高、最低气温的折线统计图,求这7天的日最高气温的第10百分位数和日最低气温的第80百分位数. 解 由折线图可知,把日最高气温按照从小到大排序,得 24,24.5,24.5,25,26,26,27, 因为共有7个数据,所以7×10%=0.7,不是整数,所以这7天日最高气温的第10百分位数是第1个数据,为24℃. 把日最低气温按照从小到大排序,得 12,12,13,14,15,16,17, 因为共有7个数据,所以7×80%=5.6,不是整数,所以这7天日最低气温的第80百分位数是第6个数据,为16℃. 10.某网络营销部门随机抽查了某市200名网友在2019年11月11日的网购金额,所得数据如下表: 网购金额(单位: 千元) 人数 频率 (0,1] 16 0.08 (1,2] 24 0.12 (2,3] x p (3,4] y q (4,5] 16 0.08 (5,6] 14 0.07 合计 200 1.00 已知网购金额不超过3千元与超过3千元的人数比恰为3∶2. (1)试确定x,y,p,q的值,并补全频率分布直方图(如图); (2)估计网购金额的25%分位数(结果保留3位有效数字). 解 (1)根据题意有: 解得 所以p=0.4,q=0.25. 补全频率分布直方图如图所示: (2)由 (1)可知,网购金额不高于2千元的频率为 0.08+0.12=0.2, 网购金额不高于3千元的频率为0.2+0.4=0.6, 所以网购金额的25%分位数在(2,3]内, 则网购金额的25%分位数为2+ ×1=2.125≈2.13(千元). 能力提升 11.数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的第65百分位数是4.5,则实数x的取值范围是( ) A.[4.5,+∞)B.[4.5,6.6) C.(4.5,+∞)D.(4.5,6.6] 解析 因为8×65%=5.2,所以这组数据的第65百分位数是第6项数据4.5,则x≥4.5,故选A. 答案 A 12.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组: [20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图: (1)估计总体400名学生中分数小于70的人数; (2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)根据该大学规定,把15%的学生划定为不及格,利用 (2)中的数据,确定本次测试的及格分数线,低于及格分数线的学生需要补考. 解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4. 所以估计总体400名学生中分数小于70的人数为 400×0.4=160. (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为 400× =20. (3)设分数的第15百分位数为x, 分数小于50的频率为1-(0.01+0.02+0.04+0.02)×10=0.1,分数小于60的频率为0.1+0.1=0.2, 所以x∈[50,60),则0.1+(x-50)×0.01=0.15, 解得x=55,则本次考试的及格分数线为55分. 创新猜想 13.(多选题)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( ) A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的平均数等于乙的成绩的平均数 C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数 D.甲的成绩的极差等于乙的成绩的极差 解析 由图可得, 甲= =6, 乙= =6,A项错误,B项正确; 甲的成绩的第80百分位数 =7.5,乙的成绩的第80百分位数 =7.5,所以二者相等,所以C项正确; 甲的成绩的极差为4,乙的成绩的极差也为4,D项正确. 答案 BCD 14.(多填题)对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得: (1)[25,30)年龄组对应小矩形的高度为________; (2)由频率分布直方图估计志愿者年龄的85%分位数为________岁. 解析 (1)设[25,30)年龄组对应小矩形的高度为h,则 5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04. (2)由图可知,年龄小于35岁的频率为(0.01+0.04+0.07)×5=0.6,年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9, 所以志愿者年龄的85%分位数在[35,40)内, 因此志愿者年龄的85%分位数为35+ ×5≈39(岁). 答案 (1)0.04 (2)39
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 922 总体百分位数的估计 总体 百分 位数 估计