学年高中数学 第二章 统计1备考学案 新人教A版必修3doc.docx
- 文档编号:2058180
- 上传时间:2022-10-26
- 格式:DOCX
- 页数:10
- 大小:195.63KB
学年高中数学 第二章 统计1备考学案 新人教A版必修3doc.docx
《学年高中数学 第二章 统计1备考学案 新人教A版必修3doc.docx》由会员分享,可在线阅读,更多相关《学年高中数学 第二章 统计1备考学案 新人教A版必修3doc.docx(10页珍藏版)》请在冰豆网上搜索。
学年高中数学第二章统计1备考学案新人教A版必修3doc
2019-2020学年高中数学第二章统计1备考学案新人教A版必修3
一、随机抽样
1.简单随机抽样
设一个总体的个数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.
(1)抽签法
制签→抽签→成样
抽签法简便易行,当总体的个体数不多时,适宜采用这种方法.
(2)随机数表法
编号→数数→成样结论:
①用简单随机抽样,从含有N个个体的总体中抽取一个容量为的样本时,每次抽取一个个体时任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为;
②基于此,简单随机抽样体现了抽样的客观性与公平性;
③简单随机抽样的特点:
它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样.
2.系统抽样
当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先制定的规则,从每一部分抽取1个个体,得到所需的样本,这种抽样叫做系统抽样(也称为机械抽样).
系统抽样的步骤可概括为:
编号→分段→确定起始的个体编号→抽取样本
按照先确定的规则(常将加上间隔)抽取样本:
.
3.分层抽样
当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层.
结论:
(1)分层抽样是等概率抽样,它也是公平的.用分层抽样从个体数为N的总体中抽取一个容量为的样本时,在整个抽样过程中每个个体被抽到的概率相等,都等于;
(2)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表性,在实践的应用更为广泛.
例1:
在简单随机抽样中,某一个个体被抽中的可能性( ).
A.与第几次抽样无关,第一次抽中的可能性要大些
B.与第几次抽样无关,每次抽中的可能性都相等
C.与第几次抽样有关,最后一次抽中的可能性要大些
D.每个个体被抽中的可能性无法确定
例2:
假设要抽查某种品牌的850颗种子的发芽率,抽取60颗进行实验.利用随机数表抽取种子时,先将850颗种子按001,002,…,850进行编号,如果从随机数表第8行第2列的数3开始向右读,请你依次写出最先检测的4颗种子的编号________.
(下面摘取了随机数表第7行至第9行)
8442175331 5724550688 77047447672176335025 8392120676
6301637859 1695556719 98105071751286735807 4439523879
3321123429 7864560782 52420744381551001342 9966027954
例3:
某单位有840名职工,现采用系统抽样方法,抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ).
A.11B.12C.13D.14
例4:
某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.
二、用样本估计总体
1.频率分布的概念:
频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:
(1)计算一组数据中最大值与最小值的差,即求极差;
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图.
2.茎叶图
制作方法:
将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).
3.众数、中位数、平均数
(1)众数:
一组数据中出现次数最多的数称为这组数据的众数.一组数据中的众数可能不止一个,反映了该组数据的集中程度.
(2)中位数:
一组数据按从小到大的顺序排成一列,处于中间位置的数称为这组数据的中位数.一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.
(3)平均数:
一组数据的和与这组数据的个数的商.数据x1,x2,…,xn的平均数为
n=.
4.方差、标准差
(1)方差s2=,描述一组数据围绕平均数波动程度的大小.
(2)标准差s=.
若数据组x1,x2,…,xn的平均数为,方差为s2,标准差为s,则数据组ax1+b,ax2+b,…,axn+b(a,b为常数)的平均数为a+b,方差为a2s2,标准差为as.
例1:
在某电脑杂志的一篇文章中,每个句子的字数如下
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.
(1)画出两组数据的茎叶图;
(2)比较分析两组数据,能得出什么结论?
例2:
对某校高三年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图如图所示.
分组
频数
频率
[10,15)
10
0.25
[15,20)
24
n
[20,25)
m
p
[25,30]
2
0.05
合计
M
1
(1)求出表中M,p及图中a的值;
(2)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;
(3)估计这次学生参加社区服务人数的众数、中位数以及平均数.
例3:
某班级有50名学生,其中有30名男生和20名女生.随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( ).
A.这种抽样方法是一种分层抽样
B.这种抽样方法是一种系统抽样
C.这五名男生成绩的方差大于这五名女生成绩的方差
D.该班男生成绩的平均数小于该班女生成绩的平均数
三、频率分布折线图、总体密度曲线
1.频率分布折线图
定义:
连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
2.总体密度曲线
定义:
在样本频率分布直方图中,随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映总体在各个范围内取值的百分比,给我们提供更加精细的信息.
四、变量间的相关关系
1.相关关系:
当一个变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化.变量间的这种相互关系,称为两变量的相关关系.
2.散点图:
将有相关关系的两变量的数据作为点的坐标,在平面直角坐标系中表示出来,所得到的图称之为散点图.散点图直观上是一些分散的点.
正相关:
散点散布在从左下角到右上角的区域时,这样的两变量的相关关系,称为正相关;
负相关:
散点散布在从左上角到右下角的区域时,这样的两变量的相关关系,称为负相关.
3.线性相关:
如果散点图中各点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线称之为回归直线,直线的方程称之为回归直线方程.
4.最小二乘法求回归直线方程:
,其中,回归直线必过一个定点:
.当一个变量已知时,由回归直线方程可以估算出另一个变量的近似值.
5.线性相关系数r:
r为正时,表明正相关;r为负时,表明负相关.
例1:
由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方程=bx+a,那么下面说法不正确的是( ).
A.直线=bx+a必经过点(,)
B.直线=bx+a至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
C.直线=bx+a的斜率为
D.直线=bx+a和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差yi-(bxi+a)]2是该坐标平面上所有直线与这些点的偏差中最小的直线
例2:
下列说法正确的是( ).
A.对于相关系数r来说,|r|≤1,|r|越接近0,相关程度越大;|r|越接近1,相关程度越小
B.对于相关系数r来说,|r|≥1,|r|越接近1,相关程度越大;|r|越大,相关程度越小
C.对于相关系数r来说,|r|≤1,|r|越接近1,相关程度越大;|r|越接近0,相关程度越小
D.对于相关系数r来说,|r|≥1,|r|越接近1,相关程度越小;|r|越大,相关程度越大
例3:
某地区2007年至2013年农村居民家庭人均纯收入y(单位:
千元)的数据如下表
年份
2007
2008
2009
2010
2011
2012
2013
年份代号
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)求y关于t的线性回归方程;
(2)利用
(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入,附:
回归直线的斜率和截距的最小二乘估计公式分别为:
=,=-.
本章整合
参考答案:
一、随机抽样
例1:
【答案】B
【解析】在简单随机抽样中,每一个个体被抽中的可能性都相等,与第几次抽样无关.
例2:
【答案】301,637,169,555
【解析】第8行第2列的数3开始向右读第一个小于850的数字是301,
第二个数字是637,也符合题意,
第三个数字是859,大于850,舍去,
第四个数字是169,符合题意,
第五个数字是555,符合题意,
故答案为:
301,637,169,555.
例3:
【答案】B
【解析】根据系统抽样的等可能性可知,每人入选的可能性都是,由题设可知区间[481,720]的人数为240,所以编号落入区间[481,720]的人数为×240=12.
例4:
【答案】37 20
【解析】由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第8组抽出的号码为22+(8-5)×5=37.
二、用样本估计总体
例1:
解:
(1)依题意,画出茎叶图如下图所示
(2)电脑杂志文章中每个句子的字数集中在10~30之间,中位数为22.5,
而报纸文章中每个句子的字数集中在20~40之间,中位数为27.5.
还可以看出,电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.
这与电脑杂志作为科普读物需要简明、通俗易懂的要求相吻合.
例2:
解:
(1)由分组[10,15)内的频数是10,频率是0.25,知=0.25,所以M=40.
因为频数之和为40,所以10+24+m+2=40,m=4,p===0.10.
因为a是对应分组[15,20)的频率与组距的商,所以a==0.12.
(2)因为该校高三学生有240人,分组在[10,15)内的频率是0.25.
所以估计该校高三学生参加社区服务的次数在此区间内的人数为60.
(3)估计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 学年高中数学 第二章 统计1备考学案 新人教A版必修3doc 学年 高中数学 第二 统计 备考 新人 必修 doc