高中数学高考综合复习专题概率与统计二Word文档格式.docx
- 文档编号:17337003
- 上传时间:2022-12-01
- 格式:DOCX
- 页数:28
- 大小:136.88KB
高中数学高考综合复习专题概率与统计二Word文档格式.docx
《高中数学高考综合复习专题概率与统计二Word文档格式.docx》由会员分享,可在线阅读,更多相关《高中数学高考综合复习专题概率与统计二Word文档格式.docx(28页珍藏版)》请在冰豆网上搜索。
④按照事先确定的规则抽取样本:
通常是将
加上间隔
,得到第2个编号
+
,再将(
)加上
,得到第3个编号
,如此继续下去,直到获得整个样本。
3o 分层抽样
当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,而后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层,分层抽样与简单随机抽样或系统抽样的联系:
将总体分成几层,分层抽取时采用简单随机抽样或系统抽样。
(2)分层抽样的特点
分层抽样充分利用了已知信息,使样本具有较好的代表性,在各层抽样时,可以根据具体情况采取不同的抽样方法,按照各层所占比例抽取样本。
小结:
三种抽样方法的比较
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
抽样过程中每个个体被抽取的概率相等
从总体中逐个抽取
总体中的个体数较少
系统抽样
将总体均匀分成几部分,按事先确定的规则在各部分抽取
在起始部分抽取时采用简单随机抽样
总体中的个体数较多
分层抽样
将总体分成几层,分层进行抽取。
各层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
2、总体分布的估计
用样本的某种特征去估计总体的相应特征,是统计学处理问题的基本方法,其中的重要方面,是利用样本的频率分布估计总体取值的概率分布规律(总体分布),即利用频率分布表、条形图及频率分布直方图去估计分布。
1o 第一种情况
当总体中的个体取的值很少时,其频率分布的表示形式主要有两种:
(1)频率分布表:
由所取样本的不同数值及其相应频率构制而成。
试验结果
频数
频率
第一组个体所取数值
第二组个体所取数值
…
在这里,对总体中的个体所取数值进行分组之后,落在各个小组内的数值的个数叫做频数,每一小组的频数与数据总数的比值叫做这一小组的频率,其特点是:
在对n个数据进行整理的频率分布表中,各组的频数的总和等于样本容量,各组频率的总和则等1。
(2)条形图:
上述频率分布表的几何表示
其中,横轴表示试验结果的若干情况(即个体的若干取值),纵轴表示各试验结果的频率值(即个体取不同数值的频率),条形图是用其高度表示取各值的频率(参见课本典型问题的条形图)。
2o 第二种情况
当总体中的个体取不同数值较多,甚至无限时,其频率分布的表示形式为以下两种形式:
(1)频率分布表
研究一批数据的频率分布,一般按以下步骤进行
①计算数据中最大值与最小值的差(极差),了解这批数据变动的范围。
②决定组数与组距:
根据一批数据的多少,将数据分成若干组,目的是描述数据分布的规律,组距是指每个小组的两个端点之间的距离。
③决定分点:
使分点与数据多一位小数,并且把第一组的起点稍微减小一点。
④列出频率分布表:
已知数据落在各小组内的数据的个数叫做这一小组的频数,每小组的频数与数据总数的比值叫做这一小组的频率,计算出各个小组的频率,填入表中
分组
频数累计
这个表叫做频率分布表
(2)频率分布直方图
为将频率分布表中的结果直观形象地表示出来,常常绘制出频率分布直方图:
以横轴表示各组分布,纵轴表示(各组)频率与组距的比值,以各个组距为底,以各组频率除以组距的商为高,分别画成矩形,便得到频率分布直方图,在这里,每个矩形面积都等于相应小组的频率,即小矩形面积=
各组频率之和等于1,即各小矩形的面积之和为1。
3o 两种情况的比较与延伸
有比较才能有鉴别,比较与鉴别是深化认知的基本途径。
(1)上述两种情况的不同之处
情况1的频率分布表中列出的是几个不同数值的频率,相应的条形图是用其高度来表示各个值的频率;
情况2的频率分布表列出的是在各个不同区间内取值(连续型总体)的频率,相应的直方图是用矩形面积的大小来表示在相应区间内取值的频率。
(2)延伸
当样本容量无限增大,分组的组距无限缩小时,频率直方图便会无限接近于一条光滑曲线——总体密度曲线,总体密度曲线反映了总体分布,即反映了总体在各个范围内取值的概率,根据这一曲线,可求出总体在区间(
)内取值的概率:
它等于总体密度曲线,直线
轴共同围成的图形面积。
同一试验中的每次抽取个体,可以看成在同一随机试验下相应随机变量所取的一个值,当总体与随机变量如此沟通之后,总体分布即相应的随机变量的频率分布,于是,我们可以运用概率的理论来研究和解决统计问题。
3、正态分布
如果随机变量ξ的概率密度函数为
,则称ξ服从参数为μσ的正态分布,记作ξ~N(
),
的图象称为正态曲线。
特例:
当μ=0,σ=1时,正态总体称为标准正态总体,相应的函数表达式为
,相应的曲线称为标准正态曲线。
(Ⅰ)若ξ~N(
),则参数μ表示总体的平均数:
Eξ=μ;
参数σ表示总体的标准差:
(Ⅱ)当ξ~N(
)时,
(2)正态曲线的性质
(Ⅰ)曲线在x轴上方,与x轴不相交;
(Ⅱ)曲线关于直线x=μ对称;
(Ⅲ)当x=μ时曲线位于最高点;
(Ⅳ)当x<μ时,曲线上升,当x>μ时,曲线下降,并且当曲线向左、右两边无限延伸时,以x轴为渐进线,向x轴无限靠近,呈现出“中间高、两边低”的钟型曲线。
(Ⅴ)当μ一定时,曲线的形状由σ确定,σ越大,曲线矮胖,表示总体的分布越分散;
σ越小,曲线瘦高,表示总体的分布越集中。
(Ⅵ)当σ相同时,正态分布曲线的位置由期望值μ确定。
(3)正态分布与标准正态分布
,则称ξ服从标准正态分布,即ξ~(0,1)。
1o 当ξ~(0,1)时,
①在标准正态分布表中,相应于x0的值φ(x0)是指总体取值小于x0的概率,即φ(x0)=P(x<x0)其中,当x0≥0时,φ(x0)的值可在标准正态分布表中查到;
当x0<0时,由φ(x0)=1-φ(-x0)计算φ(x0)的值。
在这里,标准正态曲线与x轴之间的区域面积表示总体取值的概率,其值为1。
②
据此通过查出标准正态分布表中x=a,x=b时φ(x)的值,进而计算出概率
2o 当ξ~N(
(Ⅰ)
(Ⅱ)
(4)假设检验方法的基本思想与生产过程中质量控制图
(Ⅰ)假设检验的基本思想
根据小概率事件在一次试验中几乎不可能发生的原理和从总体中抽测的个体的数值,对事先所作的统计假设作出判断:
是拒绝假设,还是接受假设。
假设检验是就正态总体而言,进行假设检验的三部曲为
①提出统计假设,统计假设中的变量服从正态分布
②确定一次实验中的取值
是否落入范围
③作出推断:
如果
,则接受统计假设;
如果
,则拒绝统计假设。
(Ⅱ)生产过程中的质量控制图及其原理
生产过程中的质量控制图及其原理,根据上述假设检验的基本思想制作:
将正态分布曲线顺时针旋转90o即得质量控制图(本书从略)。
四、经典例题
例1、某单位有120人,其中青年技术工人60人,工程师36人,技术研究人员24人,从中抽取一个容量为20人的样本,分别采用简单随机抽样、分层抽样和系统抽样三种方法,试论证不论哪种抽样方法,每个个体被抽到的概率都是相等的。
证明:
(1)简单随机抽样法:
每个个体被抽到的概率均为
(2)系统抽样方法:
将120人平均分成20个小组,每组6人,每组取1人,则每个个体被抽到的概率也是
(3)分层抽样法:
青年技工、工程师、研究员之比为60:
36:
24=5:
3:
2,又
,
,故应当从青年技工、工程师、研究员中分别抽取10人,6人,4人,每个个体被抽到的概率分别为
,即均为
于时可知,不论采用哪一种抽样方法,总体的每一个个体被抽到的概率都是
点评:
简单随机抽样法、系统抽样法、分层抽样法,这三种抽样方法既存在差异又相互联系,三种抽样方法的共同点:
在抽样过程中,每一个个体被抽到的概率都是相等的,均等于样本容量n与总体中的个体数量N的比值
例2、
(1)某中学高一年级组有400人,高二年级组有320人,高三年级组有280人,以每人被抽取的概率为0.2,向该中学抽取一个容量为n的样本,则n= ;
(2)若从高一的107名学生中,采用系统抽样法抽取10名学生作为样本,则每名学生被抽到的概率为 。
解:
(1)由
得n=200;
(2)循着系统抽样的步骤,“从107名学生中随机抽取100名,即随机剔除7名”,则任一学生a被抽取的概率为
,又“将这100名学生平均分成10部分,再从每一部分中抽取一名学生”,学生a被抽取的概率为
,故在这一抽样过程中学生a被抽取的概率为
我们从本例再一次看到,不管应用上述哪一种抽样方法,从个体数为N的总体中抽取容量为n的样本,每个个体被抽取的概率均为
例3、
(1)要从10名女生和5名男生中选出6名学生组成数学研究性学习小组,如果按性别比例分层随机抽样,则组成该学习小组的概率为 ;
(2)某同学有课外书36本,其中教辅类图书18本,文学类图书12本,其它类型图书6本,现要从中抽取一个容量为n的样本,若采用系统抽样和分层抽样,都不必剔除个体;
若样本容量为n+1,则采用系统抽样时,需要从总体中剔除1个个体,则n= 。
(1)注意到
,故按性别比例应抽取男生
(名),抽取女生
(名),组成研究性学习小组的个数为
,又从15名学生中选6名组成学习小组的结果总数
,故所求概率为
(2)由题设知,采用系统抽样时,对整个编号分段的间隔
由此得n的可能取值为n=4,6 ①
又由已知得
②
∴由①、②得n=6。
例4、
(1)已知
,Eξ≤3,Dξ=1,则P(-1<
ξ≤1)等于 (用φ(x)的值表示)。
(2)已知
,则
= 。
(3)已知离散型随机变量ξ~N(0,1),P(ξ≤0)= ;
P(-2<ξ<2)= 。
(4)抽样调查表时,某中学高三年级学生成绩(总分750分)近似服从正态分布,平均成绩500分,若P(400<x<450)=0.3,则P(550<x<600)=
分析:
(1)由μ,σ2的定义得μ=3,σ2=1
故有ξ~N(3,1),
∴
(2)借助换元转化:
令
,则η~N(0,1)
即
查标准正态分布表得φ(0.20)=0.5793,
故有
,解得
=10;
(3)注意到标准正态曲线的对轴轴为x=10,并且这里σ=1,
(4)注意到x~N(500,σ2),其概率密度曲线关于直线x=500对称,
故在以μ=500为中心的对称区间[400,450]与[550,600]上x取值的概率相等,
于是可得
在这里
(1)、
(2)的求解利用了“三基”:
基本概念、基本方法与基本公式,而(3)、(4)的求解则主要运用了概率密度曲线的几何性质,它们从不同的侧面展示了正态分布问题的解题策略。
例5、设随机变量
,且已知P(η<0.5)=0.0793,P(η>1.5)=0.7611,求μ和σ的值。
考虑利用标准正态分布转化为方程组问题求解。
∵
∴由P(η<0.5)=0.0793得
查表得
①
由P(η>1.5)=0.7611得P(η≤1.5)=0.2389
②
于是将①、②联立解得μ=2.515,σ=1.43。
本例展示了正态分布问题中寻求待定系数的基本方法。
例6、已知生产工艺过程中产品的尺寸偏差ξ(mm)~M(0,2.5),如果产品的尺寸与规定的尺寸偏差的绝对值不超过3mm为合格品,试求
(1)ξ的概率密度函数;
(2)生产的5件产品的合格率不小于80%的概率。
得μ=0,σ2=2.5
∴μ=0,
∴ξ的概率密度函数为
(2)设η表示5件产品中的合格品数,则由题意知η服从二项分布,
且η~(5,p),其中
=0.9426
=
≈0.9707
例7、某射手对100个靶各射击5次,记下命中数,射击结果如下表:
命中数
1
2
3
4
5
18
29
31
14
(1)列出频率分布表;
(2)画出频率分布条形图;
(3)求命中不少于3次的概率。
合计
100
0.03
0.18
0.29
0.31
0.14
0.05
(2)频率分布条形图如图所示:
(3)由频率分布表知命中不少于3次的概率为0.31+0.14+0.05=0.50
例8、为了解高中学生的身高情况,对育才中学同龄的50名男生的身高进行了测量,结果如下:
(单位:
cm)
175
168
170
176
167
181
162
173
171
177
174
166
163
160
164
165
158
172
161
157
169
试列出样本的频率分布表,画出频率分布直方图。
在这个样本中,最大值为181,最小值为157,极差为181-157=24,据此取组距为4,分为7组,并取第一组起点为156.5,则根据题间列出样本的频率分布表如下:
156.5~160.5
0.06
160.5~164.5
0.08
164.5~168.5
12
0.24
168.5~172.5
172.5~176.5
13
0.26
176.5~180.5
180.5~184.5
0.04
50
1.00
根据上表,画出所求频率直方图如下:
例9、某中学高一年级期末后,为评价该年级的数学成绩,从中抽取50人作为样本,成绩记录如下:
47
49
53
55
60
61
63
65
66
67
69
70
72
73
74
75
76
78
79
80
81
83
84
85
86
88
90
95
96
97
98
(1)列出样本的频率分布表(含累积频率);
(2)画出频率直方图和累积频率分布图;
(3)根据累积分布图,估计数学优秀率(85分以上)所占百分比。
(1)在这个样本中,最大值为98,最小值为47,极差98-47=51。
据此取组距为10,分为6组,并取第一组起点为40,第6组终点为100;
根据题意样本的频率分布表如下:
成绩分组
累积频率
[40,50)
0.04
[50,60)
0.04+0.06=0.10
[60,70)
10
0.20
0.04+0.06+0.20=0.30
[70,80)
15
0.30
0.04+0.06+0.20+0.30=0.60
[80,90)
0.04+0.06+0.20+0.30+0.24=0.84
[90,100)
8
0.16
0.04+0.06+0.20+0.30+0.24+0.16=1.00
(2)频率直方图:
累积频率分布图:
从略。
(3)由累积分布图可知,85分以下的学生成绩约占70%,故数学优秀率约为30%。
五、高考真题
(一)选择题
1.某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;
使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:
①7,34,61,88,115,142,169,196,223,250;
②5,9,100,107,111,121,180,195,200,265;
③11,38,65,92,119,146,173,200,227,254;
④30,57,84,111,138,165,192,219,246,270。
关于上述样本的下列结论中,正确的是( )
A.②、③都不能为系统抽样 B.②、④都不能为分层抽样
C.①、④都可能为系统抽样 D.①、③都可能为分层抽样
由系统抽样的特点知,④不是系统抽样,否定C;
③可能为系统抽样,由此又否定A。
又由题设知,若采用分层抽样,则各年级抽取的人数比为108:
81:
81=4:
3,一年级标号1~108,二年级标号109~189,三年级标号190~270,因而1~10应有4个号,109~189有3个号,190~270有3个号,据此否定B,因此应选D。
2.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为( )
A.0.27,78 B.0.27,83 C.2.7,78 D.2.7,83
由频数与频率的关系知,若频数成等差数列或等比数列,则相应地频率也成等差数列或等比数列。
设从左至右9组的频率依次为a1,a2,a3,a4,a5,a6,a7,a8,a9,其中a1=0.01,a2=0.03,
∵
,a1,a2,a3,a4成等比数列,
∴
,
并且a1,a2,a3,a4中a4最大 ①
又设a4,a5,a6,a7,a8,a9的公差为d,
则
另一方面,
由此解得
中a4最大 ②
∴由①、②得
③
因此,
∴第4组至第7组的频数为0.78×
100=78.
即b=78 ④
于是由③,④知,应选A。
若注意到a为频率,故这里0<
a<
1,由此理否定C,D,故解题的关键是求解b的值。
(二)填空题
1.经问卷调查,某班学生对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”的多12
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高中数学高考综合复习专题 概率与统计二 高中数学 高考 综合 复习 专题 概率 统计