第19讲 用样本估计总体及线性相关关系Word文档下载推荐.docx
- 文档编号:18499642
- 上传时间:2022-12-17
- 格式:DOCX
- 页数:13
- 大小:145.45KB
第19讲 用样本估计总体及线性相关关系Word文档下载推荐.docx
《第19讲 用样本估计总体及线性相关关系Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《第19讲 用样本估计总体及线性相关关系Word文档下载推荐.docx(13页珍藏版)》请在冰豆网上搜索。
2.频率分布直方图、折线图与茎叶图
样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率。
所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示。
频率分布直方图:
具体做法如下:
(1)求极差(即一组数据中最大值与最小值的差);
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图。
注:
频率分布直方图中小正方形的面积=组距×
=频率。
折线图:
连接频率分布直方图中小长方形上端中点,就得到频率分布折线图。
总体密度曲线:
当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。
3.线性回归
回归分析:
对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。
回归直线方程:
设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在某一条直线的附近,就可以认为y对x的回归函数的类型为直线型:
。
其中
,
我们称这个方程为y对x的回归直线方程。
四.典例解析
题型1:
数字特征
例1.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:
(1)在这个问题中,总体、个体、样本和样本容量各是什么?
(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径.
解析:
(1)总体是要检查的这批手榴弹的杀伤半径的全体;
个体是每一颗手榴弹的杀伤半径;
样本是所抽取的20颗手榴弹的杀伤半径;
样本容量是20。
(2)在20个数据中,10出现了6次,次数最多,所以众数是10(米)。
20个数据从小到大排列,第10个和第11个数据是最中间的两个数,分别为9(米)和10(米),所以中位数是
(9+10)=9.5(米)。
样本平均数
(米)
所以,估计这批手榴弹的平均杀伤半径约为9.4米。
点评:
(1)根据总体、个体、样本、样本容量的概念答题.要注意:
总体、个体和样本所说的考察对象是一种数量指标,不能说成考察的对象是手榴弹,而应说是手榴弹的杀伤半径。
(2)读懂表格的意义,利用概念求众数、中位数,用样本平均数估计这批手榴弹的平均杀伤半径.另外在这里要会简便计算有多个重复数据的样本的平均数。
例2.为估计一次性木质筷子的用量,1999年从某县共600家高、中、低档饭店抽取10家作样本,这些饭店每天消耗的一次性筷子盒数分别为:
0.63.72.21.52.8
1.71.22.13.21.0
(1)通过对样本的计算,估计该县1999年消耗了多少盒一次性筷子(每年按350个营业日计算);
(2)2001年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是10个样本饭店,每个饭店平均每天使用一次性筷子2.42盒.求该县2000年、2001年这两年一次性木质筷子用量平均每年增长的百分率(2001年该县饭店数、全年营业天数均与1999年相同);
(3)在
(2)的条件下,若生产一套学生桌椅需木材0.07m3,求该县2001年使用一次性筷子的木材可以生产多少套学生桌椅。
计算中需用的有关数据为:
每盒筷子100双,每双筷子的质量为5g,所用木材的密度为0.5×
103kg/m3;
(4)假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去做,简要地用文字表述出来。
(1)
所以,该县1999年消耗一次性筷子为2×
600×
350=420000(盒)。
(2)设平均每年增长的百分率为X,则2(1+X)2=2.42,
解得X1=0.1=10%,X2=-2.1(不合题意,舍去)。
所以,平均每年增长的百分率为10%;
(3)可以生产学生桌椅套数为
(套)。
(4)先抽取若干个县(或市、州)作样本,再分别从这些县(或市、州)中抽取若干家饭店作样本,统计一次性筷子的用量.
本题是一道统计综合题,涉及的知识点很多,需要灵活运用各种知识分析解决问题.对于第
(1)小题,可先求得样本平均数,再利用样本估计总体的思想来求得问题的解.对于第
(2)小题,实际是一个增长率问题的应用题,可通过设未知数列方程的方法来解.对于第(3)小题,用到了物理公式m=ρv, 体现了各学科知识之间的联系,让学生触类旁通,在解决实际问题时能综合运用多种知识灵活地解决问题.第(4)小题只要能够运用随机抽样方法,能体会到用样本估计总体的统计思想就可解决,在文字表述上要注意简洁、明了、正确。
题型2:
数字特征的应用
例3.(2002年全国高考天津文科卷(15))甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:
t/hm2)
品种
第1年
第2年
第3年
第4年
第5年
甲
9.8
9.9
10.1
10
10.2
乙
9.4
10.3
10.8
9.7
其中产量比较稳定的小麦品种是甲。
甲=
(9.8+9.9+10.1+10+10.2)=10.0,
乙=
(9.4+10.3+10.8+9.7+9.8)=10.0;
s
=
(9.82+…+10.22)–102=0.02,s
(9.42+…+9.82)–102=0.244>
0.02。
方差与平均数在反映样本的特征上一定要区分开。
例4.(2005江苏7)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:
9.48.49.49.99.69.49.7
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为
(A)9.4,0.484(B)9.4,0.016(C)9.5,0.04(D)9.5,0.016
答案:
D;
7个数据中去掉一个最高分和一个最低分后,余下的5个数为:
9.4,9.4,9.6,9.4,9.5。
则平均数为:
,即
方差为:
即
,故选D。
一定要根据实际的题意解决问题,并还原实际情景。
题型3:
频率分布直方图与条形图
例5.为检测,某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,而极品8件,三级品13件,次品14件.
(1)列出样本频率分布表;
(2)画出表示样本频率分布的条形图;
(3)根据上述结果,估计辞呈商品为二极品或三极品的概率约是多少
(1)样本的频率分布表为
产品
频数
频率
一级晶
5
0.17
二级晶
8
0.27
三级晶
13
0.43
次品
4
0.13
(2)样本频率分布的条形图为:
(3)此种产品为二极品或三极品的概率约为0.27+0.43=0.7。
条形图中纵坐标一般是频数或频率。
例6.(2006重庆理,6)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:
根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是
(A)20(B)30
(C)40(D)50
C;
根据运算的算式:
体重在〔56.5,64.5〕学生的累积频率为2×
0.03+2×
0.05+2×
0.07=0.4,则体重在〔56.5,64.5〕学生的人数为0.4×
100=40。
熟悉频率、频数、组距间的关系式。
例7.某中学对高三年级进行身高统计,测量随机抽取的40名学生的身高,其结果如下(单位:
cm)
分组
[140,145)
[145,150)
[150,155)
[155,160)
[160,165)
[165,170)
[170,175)
[175,180)
合计
人数
1
2
5
9
13
6
3
40
(1)列出频率分布表;
(2)画出频率分布直方图;
(3)估计数据落在[150,170]范围内的概率。
(1)根据题意可列出频率分布表:
分 值
频 数
频 率
[140,145]
0.025
[145,150]
0.050
[150,155]
0.125
[155,160]
0.225
[160,165]
0.325
[165,170]
0.15
[170,175]
0.075
[175,180]
合 计
1.00
(2)频率分布直方图如下:
(3)数据落在[150,170]范围内的概率约为0.825。
题型4:
茎叶图
例8.观看下面两名选手全垒打数据的茎叶图,对他们的表现进行比较。
1961年扬基队外垒手马利斯打破了鲁斯的一个赛季打出60个全垒打的记录。
下面是扬基队的历年比赛中的鲁斯和马利斯每年击出的全垒打的比较图:
鲁斯马利斯
08
1346
522368
54339
9766114
9445
061
鲁斯的成绩相对集中,稳定在46左右;
马利斯成绩相对发散,成绩稳定在26左右。
题型5:
线性回归方程
例9.由施肥量x与水稻产量y试验数据的关系,画出散点图,并指明相关性。
散点图为:
通过图象可知是正相关。
例10.在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:
时间t(s)
15
20
30
50
60
70
90
120
深度y(
m)
16
17
19
23
25
29
46
(1)画出散点图;
(2)试求腐蚀深度y对时间t的回归直线方程。
略解:
(1)散点图略,呈直线形。
(2)经计算可得
=46.36,
=19.45,
=36750,
=5442,
=13910。
B=
=
0.3.
A=
-b
=19.45-03
5.542。
故所求的回归直线方程为
=0.3t+5.542。
题型6:
创新题
例11.把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.
已知前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为1-0.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数。
由已知知前七组的累积频数为0.79×
100=79,故后三组共有的频数为21,依题意
=21,a1(1+q+q2)=21.∴a1=1,q=4。
∴后三组频数最高的一组的频数为16。
此题剖析只按第二种思路给出了解答,你能按第一种思路来解吗?
例12.某班学生在一次数学考试中成绩分布如下表:
分数段
[0,80)
[80,90)
[90,100)
)
[100,110)
[110,120
[120,130)
8
12
[130,140)
[140,150)
4
那么分数在[100,110)中的频率和分数不满110分的累积频率分别是______________、_______(精确到0.01).
由频率计算方法知:
总人数=45.
分数在[100,110)中的频率为
=0.178≈0.18.
分数不满110分的累积频率为
≈0.47.
0.180.47
五.思维总结
1.统计是为了从数据中提取信息,学习时根据实际问题的需求选择不同的方法合理地选取样本,并从样本数据中提取需要的数字特征。
不应把统计处理成数字运算和画图表。
对统计中的概念(如"
总体"
、"
样本"
等)应结合具体问题进行描述性说明,不应追求严格的形式化定义。
2.当总体中个体取不同值很少时,我们党用样本的频率分布标记频率分布梯形图取估计总体体分布,总体分布排除了抽样造成的错误,精确反映了总体取值的概率分布规律。
对于所取不同数值较多或可以在实数区间范围内取值的总体,需用频率分布直方图来表示相应的频率分布。
当样本容量无限增大,分组的组距无限缩小时,频率分布直方图无限接近一条光滑曲线——总体密度曲线.由于总体分布通常不易知道,往往是用样本的频率分布估计总体分布。
样本容量越大,估计就越精确。
3.相关关系
研究两个变量间的相关关系是学习本节的目的。
对于相关关系我们可以从下三个方面加以认识:
(1)相关关系与函数关系不同。
函数关系中的两个变量间是一种确定性关系。
例如正方形面积S与边长x之间的关系
就是函数关系。
即对于边长x的每一个确定的值,都有面积S的惟一确定的值与之对应。
相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系。
例如人的身高与年龄;
商品的销售额与广告费等等都是相关关系。
(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。
例如有人发现,对于在校儿童,身高与阅读技能有很强的相关关系。
然而学会新词并不能使儿童马上长高,而是涉及到第三个因素——年龄,当儿童长大一些,他们的阅读能力会提高而且由于长大身高也会高些。
(3)函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化。
例如正方形面积S与其边长x间虽然是一种确定性关系,但在每次测量边长时,由于测量误差等原因,其数值大小又表现出一种随机性。
而对于具有线性关系的两个变量来说,当求得其回归直线后,我们又可以用一种确定性的关系对这两个变量间的关系进行估计。
相关关系在现实生活中大量存在,从某种意义上讲,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况。
因此研究相关关系,不仅可使我们处理更为广泛的数学应用问题,还可使我们对函数关系的认识上升到一个新的高度。
4.好破势训练,为提高能力,运用变式题目,常规题向典型问题的转化,进行多种解法训练,从不同角度,不同侧面对题目进行全面分析,结合典型的错解分析,查找思维的缺陷,提高分析解决问题的能力。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第19讲 用样本估计总体及线性相关关系 19 样本 估计 总体 线性 相关 关系