高中数学高考综合复习专题三十五 概率与统计Word格式.docx
- 文档编号:17421199
- 上传时间:2022-12-01
- 格式:DOCX
- 页数:23
- 大小:97.97KB
高中数学高考综合复习专题三十五 概率与统计Word格式.docx
《高中数学高考综合复习专题三十五 概率与统计Word格式.docx》由会员分享,可在线阅读,更多相关《高中数学高考综合复习专题三十五 概率与统计Word格式.docx(23页珍藏版)》请在冰豆网上搜索。
将总体匀分后的每一部分进行抽样时,采用的是简单随机抽样。
(2)系统抽样的步骤
①编号:
采用随机方式将总体中的个体编号;
2
②分段:
将整个编号进行分段,分段的间隔;
当时,在随机性和客观性的保障下,从总体中剔除一些个体后使剩下的总体中的个数N′能被n整除,并取
;
③确定起始个体编号:
在第一段用简单随机抽样确定起始的个体编号;
④按照事先确定的规则抽取样本:
通常是将加上间隔
得到第3个编号+
3o分层抽样
当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,而后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层,分层抽样与简单随机抽样或系统抽样的联系:
将总体分成几层,分层抽取时采用简单随机抽样或系统抽样。
(2)分层抽样的特点
分层抽样充分利用了已知信息,使样本具有较好的代表性,在各层抽样时,可以根据具体情况采取不同的抽样方法,按照各层所占比例抽取样本。
小结:
三种抽样方法的比较
2、总体分布的估计
用样本的某种特征去估计总体的相应特征,是统计学处理问题的基本方法,其中的重要方面,是利用样本的频率分布估计总体取值的概率分布规律(总体分布),即利用频率分布表、条形图及频率分布直方图去估计分布。
1o第一种情况
当总体中的个体取的值很少时,其频率分布的表示形式主要有两种:
(1)频率分布表:
由所取样本的不同数值及其相应频率构制而成。
3
,得到第2个编号+,再将(+)加上,,如此继续下去,直到获得整个样本。
在这里,对总体中的个体所取数值进行分组之后,落在各个小组内的数值的个数叫做频数,每一小组的频数与数据总数的比值叫做这一小组的频率,其特点是:
在对n个数据进行整理的频率分布表中,各组的频数的总和等于样本容量,各组频率的总和则等1。
(2)条形图:
上述频率分布表的几何表示
其中,横轴表示试验结果的若干情况(即个体的若干取值),纵轴表示各试验结果的频率值(即个体取不同数值的频率),条形图是用其高度表示取各值的频率(参见课本典型问题的条形图)。
2o第二种情况
当总体中的个体取不同数值较多,甚至无限时,其频率分布的表示形式为以下两种形式:
(1)频率分布表
研究一批数据的频率分布,一般按以下步骤进行
①计算数据中最大值与最小值的差(极差),了解这批数据变动的范围。
②决定组数与组距:
根据一批数据的多少,将数据分成若干组,目的是描述数据分布的规律,组距是指每个小组的两个端点之间的距离。
③决定分点:
使分点与数据多一位小数,并且把第一组的起点稍微减小一点。
④列出频率分布表:
已知数据落在各小组内的数据的个数叫做这一小组的频数,每小组的频数与数据总数的比值叫做这一小组的频率,计算出各个小组的频率,填入表中
这个表叫做频率分布表
(2)频率分布直方图
为将频率分布表中的结果直观形象地表示出来,常常绘制出频率分布直方图:
以横轴表示各组分布,纵轴表示(各组)频率与组距的比值,以各个组距为底,以各组频率除以组距的商为高,分别画成矩形,便得到频率分布直方图,在这里,每个矩形面积都等于相应小组的频率,即小矩形面积=
的面积之和为1。
3o两种情况的比较与延伸
有比较才能有鉴别,比较与鉴别是深化认知的基本途径。
(1)上述两种情况的不同之处;
各组频率之和等于1,即各小矩形
情况1的频率分布表中列出的是几个不同数值的频率,相应的条形图是用其高度来表示各个值的频率;
情况2的频率分布表列出的是在各个不同区间内取值(连续型总体)的频率,相应的直方图是用矩形面积的大小来表示在相应区间内取值的频率。
4
(2)延伸
当样本容量无限增大,分组的组距无限缩小时,频率直方图便会无限接近于一条光滑曲线——总体密度曲线,总体密度曲线反映了总体分布,即反映了总体在各个范围内取值的概率,根据这一曲线,可求出总体在区间(
的概率:
它等于总体密度曲线,直线
同一试验中的每次抽取个体,可以看成在同一随机试验下相应随机变量所取的一个值,当总体与随机变量如此沟通之后,总体分布即相应的随机变量的频率分布,于是,我们可以运用概率的理论来研究和解决统计问题。
3、正态分布
(1)定义轴共同围成的图形面积。
)内取值
如果随机变量ξ的概率密度函数为
正态分布,记作ξ~N(
),的图象称为正态曲线。
,则称ξ服从参数为μσ的
特例:
当μ=0,σ=1时,正态总体称为标准正态总体,相应的函数表达式为
准正态曲线。
(Ⅰ)若ξ~N(
(Ⅱ)当ξ~N(
(2)正态曲线的性质
(Ⅰ)曲线在x轴上方,与x轴不相交;
(Ⅱ)曲线关于直线x=μ对称;
(Ⅲ)当x=μ时曲线位于最高点;
)时,。
,相应的曲线称为标),则参数μ表示总体的平均数:
Eξ=μ;
参数σ表示总体的标准差:
(Ⅳ)当x<μ时,曲线上升,当x>μ时,曲线下降,并且当曲线向左、右两边无限延伸时,以x轴为渐进线,向x轴无限靠近,呈现出“中间高、两边低”的钟型曲线。
(Ⅴ)当μ一定时,曲线的形状由σ确定,σ越大,曲线矮胖,表示总体的分布越分散;
σ越小,曲线瘦高,表示总体的分布越集中。
(Ⅵ)当σ相同时,正态分布曲线的位置由期望值μ确定。
5
(3)正态分布与标准正态分布
1o当ξ~(0,1)时,,则称ξ服从标准正态分布,即ξ~(0,1)。
①在标准正态分布表中,相应于x0的值φ(x0)是指总体取值小于x0的概率,即φ(x0)=P(x<x0)其中,当x0≥0时,φ(x0)的值可在标准正态分布表中查到;
当x0<0时,由φ(x0)=1-φ(-x0)计算φ(x0)的值。
在这里,标准正态曲线与x轴之间的区域面积表示总体取值的概率,其值为1。
②
据此通过查出标准正态分布表中x=a,x=b时φ(x)的值,进而计算出概率
2o当ξ~N()时,
(Ⅰ)
(Ⅱ)
(4)假设检验方法的基本思想与生产过程中质量控制图
(Ⅰ)假设检验的基本思想
根据小概率事件在一次试验中几乎不可能发生的原理和从总体中抽测的个体的数值,对事先所作的统计假设作出判断:
是拒绝假设,还是接受假设。
假设检验是就正态总体而言,进行假设检验的三部曲为
①提出统计假设,统计假设中的变量服从正态分布
②确定一次实验中的取值
③作出推断:
如果
(Ⅱ)生产过程中的质量控制图及其原理
生产过程中的质量控制图及其原理,根据上述假设检验的基本思想制作:
将正态分布曲线顺时针旋转90o即得质量控制图(本书从略)。
四、经典例题
例1、某单位有120人,其中青年技术工人60人,工程师36人,技术研究人员24人,从中抽取一个容量为20人的
6
是否落入范围;
,则接受统计假设;
,则拒绝统计假设。
样本,分别采用简单随机抽样、分层抽样和系统抽样三种方法,试论证不论哪种抽样方法,每个个体被抽到的概率都是相等的。
证明:
(1)简单随机抽样法:
每个个体被抽到的概率均为
(2)系统抽样方法:
将120人平均分成20个小组,每组6人,每组取1人,则每个个体被抽到的概率也是;
(3)分层抽样法:
青年技工、工程师、研究员之比为60:
36:
24=5:
3:
2,又,,,故应当从青年技工、工程师、研究员中分别抽取10人,6人,4人,每个个体被抽到的概率分别为,,,即均为;
于时可知,不论采用哪一种抽样方法,总体的每一个个体被抽到的概率都是
。
点评:
简单随机抽样法、系统抽样法、分层抽样法,这三种抽样方法既存在差异又相互联系,三种抽样方法的共同点:
在抽样过程中,每一个个体被抽到的概率都是相等的,均等于样本容量n与总体中的个体数量N的比值
例2、。
(1)某中学高一年级组有400人,高二年级组有320人,高三年级组有280人,以每人被抽取的概率为0.2,向该中学抽取一个容量为n的样本,则n=;
(2)若从高一的107名学生中,采用系统抽样法抽取10名学生作为样本,则每名学生被抽到的概率为。
解:
(1)由
得n=200;
(2)循着系统抽样的步骤,“从107名学生中随机抽取100名,即随机剔除7名”,则任一学生a被抽取的概率为,又“将这100名学生平均分成10部分,再从每一部分中抽取一名学生”,学生a被抽取的概率为,故在这一抽样过程
7
中学生a被抽取的概率为
我们从本例再一次看到,不管应用上述哪一种抽样方法,从个体数为N的总体中抽取容量为n的样本,每个个体被抽取的概率均为
例3、。
(1)要从10名女生和5名男生中选出6名学生组成数学研究性学习小组,如果按性别比例分层随机抽样,则组成该学习小组的概率为;
(2)某同学有课外书36本,其中教辅类图书18本,文学类图书12本,其它类型图书6本,现要从中抽取一个容量为n的样本,若采用系统抽样和分层抽样,都不必剔除个体;
若样本容量为n+1,则采用系统抽样时,需要从总体中剔除1个个体,则n=。
(1)注意到,故按性别比例应抽取男生(名),抽取女生(名),组成研究性学习小组的个数为
,又从15名学生中选6名组成学习小组的结果总数,故所求概率为。
(2)由题设知,采用系统抽样时,对整个编号分段的间隔
由此得n的可能取值为n=4,6①,
又由已知得
∴由①、②得n=6。
例4、
(1)已知
(2)已知
②,Eξ≤3,Dξ=1,则P(-1<
ξ≤1)等于(用φ(x)的值表示)。
,则=。
(3)已知离散型随机变量ξ~N(0,1),P(ξ≤0)=;
P(-2<ξ<2)=。
8
(4)抽样调查表时,某中学高三年级学生成绩(总分750分)近似服从正态分布,平均成绩500分,若P(400<x<450)=0.3,则P(550<x<600)=
分析:
(1)由μ,σ2的定义得μ=3,σ2=1
故有ξ~N(3,1),
∴
(2)借助换元转化:
令,则η~N(0,1)
即
查标准正态分布表得φ(0.20)=0.5793,
故有
,解得=10;
(3)注意到标准正态曲线的对轴轴为x=10,并且这里σ=1,
(4)注意到x~N(500,σ2),其概率密度曲线关于直线x=500对称,;
故在以μ=500为中心的对称区间[400,450]与[550,600]上x取值的概率相等,
于是可得
在这里
(1)、
(2)的求解利用了“三基”:
基本概念、基本方法与基本公式,而(3)、(4)的求解则主要运用了概率密度曲线的几何性质,它们从不同的侧面展示了正态分布问题的解题策略。
例5、设随机变量
考虑利用标准正态分布转化为方程组问题求解。
∵
,且已知P(η<0.5)=0.0793,P(η>1.5)=0.7611,求μ和σ的值。
,9
∴由P(η<0.5)=0.0793得
查表得①
由P(η>1.5)=0.7611得P(η≤1.5)=0.2389
查表得②
于是将①、②联立解得μ=2.515,σ=1.43。
本例展示了正态分布问题中寻求待定系数的基本方法。
例6、已知生产工艺过程中产品的尺寸偏差ξ(mm)~M(0,2.5),如果产品的尺寸与规定的尺寸偏差的绝对值不超过3mm为合格品,试求
(1)ξ的概率密度函数;
(2)生产的5件产品的合格率不小于80%的概率。
(1)由得μ=0,σ2=2.5
∴μ=0,
∴ξ的概率密度函数为
(2)设η表示5件产品中的合格品数,则由题意知η服从二项分布,
且η~(5,p),其中
=0.9426
=
≈0.9707
10
例7、某射手对100个靶各射击5次,记下命中数,射击结果如下表:
(1)列出频率分布表;
(2)画出频率分布条形图;
(3)求命中不少于3次的概率。
(2)频率分布条形图如图所示:
(3)由频率分布表知命中不少于3次的概率为0.31+0.14+0.05=0.50
例8、为了解高中学生的身高情况,对育才中学同龄的50名男生的身高进行了测量,结果如下:
(单位:
cm)
试列出样本的频率分布表,画出频率分布直方图。
在这个样本中,最大值为181,最小值为157,极差为181-157=24,据此取组距为4,分为7组,并取第一组起点为156.5,则根据题间列出样本的频率分布表如下:
11
根据上表,画出所求频率直方图如下:
例9、某中学高一年级期末后,为评价该年级的数学成绩,从中抽取50人作为样本,成绩记录如下:
(1)列出样本的频率分布表(含累积频率);
(2)画出频率直方图和累积频率分布图;
(3)根据累积分布图,估计数学优秀率(85分以上)所占百分比。
(1)在这个样本中,最大值为98,最小值为47,极差98-47=51。
据此取组距为10,分为6组,并取第一组起点为40,第6组终点为100;
根据题意样本的频率分布表如下:
12
(2)频率直方图:
累积频率分布图:
从略。
(3)由累积分布图可知,85分以下的学生成绩约占70%,故数学优秀率约为30%。
五、高考真题
(一)选择题
1.(2005·
湖北卷)某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按
一、二、三年级依次统一编号为1,2,…,270;
使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270。
关于上述样本的下列结论中,正确的是()
A.②、③都不能为系统抽样B.②、④都不能为分层抽样
C.①、④都可能为系统抽样D.①、③都可能为分层抽样
由系统抽样的特点知,④不是系统抽样,否定C;
③可能为系统抽样,由此又否定A。
又由题设知,若采用分层抽样,则各年级抽取的人数比为
108:
81:
81=4:
3,一年级标号1~108,二年级标号109~189,三年级标号190~270,因而1~10应有4个号,109~189有3个号,190~270有3个号,据此否定B,因此应选D。
2.(2005·
江西卷)为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()
13
A.0.27,78B.0.27,83C.2.7,78D.2.7,83
由频数与频率的关系知,若频数成等差数列或等比数列,则相应地频率也成等差数列或等比数列。
设从左至右9组的频率依次为a1,a2,a3,a4,a5,a6,a7,a8,a9,其中a1=0.01,a2=0.03,
∴,a1,a2,a3,a4成等比数列,,
并且a1,a2,a3,a4中a4最大①
又设a4,a5,a6,a7,a8,a9的公差为d,
则
另一方面,
由此解得
∴由①、②得中a4最大②③
因此,
∴第4组至第7组的频数为0.78×
100=78.
即b=78④
于是由③,④知,应选A。
若注意到a为频率,故这里0<
a<
1,由此理否定C,D,故解题的关键是求解b的值。
14
(二)填空题
全国卷C)经问卷调查,某班学生对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”的多12人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出的是5位“喜欢”摄影的同学,1位“不喜欢”摄影的同学和3位执“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班学生人数的一半还多人。
由题设知,全班同学中对摄影“喜欢”、“不喜欢”、“一般”的人数均为5:
1:
3,
故可设这三部分学生的人数分别为5x,x,3x,全班人数为9x,
又由题设知,
∴应填3。
,
湖南)一工厂生产了某种产品16800件,它们来自甲、乙、丙3条生产线,为检验这批产品的质量,决定
采用分层抽样的方法进行抽样。
已知从甲、乙、丙3条生产线抽取的个体数组成一个等差数列,则乙生产线生产了件产品。
由题意设来自甲、乙、丙3条生产线的个体数依次为a-d,a,a+d,
则有
由此解得a=5600.
∴乙生产线生产5600件产品,应填5600。
(三)解答题
重庆卷)在一次购物抽奖活动中,假设某10张券中有一等奖券1张,可获价值为50元的奖品;
有二等奖券3张,每张可获价值为10元的奖品;
其余6张没有奖。
某顾客从10张券中抽2张,求
(1)该顾客中奖的概率;
(2)该顾客获得的奖品总价值ξ(元)的概率分布和期望Eξ。
由题设可知,从10张券中任抽两张,由此引出的每一抽奖事件为等可能性事件,于是循着古典概型的解题思路求解、计算。
(1)由题设知,顾客中奖包括两种情况:
一种情况是所抽两张券均中奖,有种结果;
种结果。
又这里基本事件总数为;
,另一种是所抽两张券中一张中奖,一张不中奖,有
∴顾客中奖的概率
(2)ξ的所有可能取值为0,10,20,50,60(元)
15
,,
故ξ的分布列为:
∴ξ的数学期望
从中奖的各种情况分析切入,导出ξ=0,10,20,50,60(元),是解题的关键环节。
湖南卷)某城市有甲、乙、丙3个旅游景点,一位客人游览这3个景点的概率分别为0.4,0.5,0.6,且客人是否游览哪个景点互不影响。
设ξ表示客人离开城市时游览的景点数与没有游览的景点数之差的绝对值。
(1)求ξ的分布列及数学期望;
(2)证“函数
为便于化抽象为具体,分别设出客人游览各景点的事件,进而考察ξ的取值与P(ξ=k)的计算。
设事件A1:
客人游览甲景点;
事件A2:
客人游览乙景点;
事件A3:
客人游览丙景点,则事件A1、A2、A3相互独立,且
在区间[2,+∞)上单调递增”为事件
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高中数学高考综合复习 专题三十五 概率与统计 高中数学 高考 综合 复习 专题 三十五 概率 统计