高中数学北师大版选修12精品学案第一章 统计案例 章末小结.docx
- 文档编号:5043551
- 上传时间:2022-12-12
- 格式:DOCX
- 页数:14
- 大小:39.59KB
高中数学北师大版选修12精品学案第一章 统计案例 章末小结.docx
《高中数学北师大版选修12精品学案第一章 统计案例 章末小结.docx》由会员分享,可在线阅读,更多相关《高中数学北师大版选修12精品学案第一章 统计案例 章末小结.docx(14页珍藏版)》请在冰豆网上搜索。
高中数学北师大版选修12精品学案第一章统计案例章末小结
第一章章末小结
1.回归分析
(1)回归分析步骤:
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其步骤:
收集数据→ 作散点图 →求回归直线方程→利用方程进行预测.
(2)线性回归模型:
y=bx+a,其中
= xi ,= yi ,2.相关系数
样本相关系数:
对于变量y与x的一组观测值,把
r==
叫作变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度,|r| ≤ 1.当r>0时,表明两个变量 正相关 ;当r<0时,表明两个变量 负相关 .|r|越接近 1 ,相关程度越 大 ;|r|越接近 0 ,相关程度越 小 .
3.条件概率与相互独立事件
(1)条件概率的定义
设A,B为两个事件,且P(A)>0,称P(B|A)= 为在事件A发生的条件下,事件B发生的条件概率.
(2)条件概率相关性质
① 0 ≤P(B|A)≤ 1 .
②若P(B)≠0,则P(AB)= P(B)P(A|B) ;
若P(A)≠0,则P(AB)= P(A)P(B|A) .
(3)相互独立事件的定义
设A,B为两个事件,如果P(AB)= P(A)P(B) ,则称事件A与事件B相互独立.
事件A(或B)是否发生对事件B(或A)发生的概率 没有 影响,这样的两个事件叫作相互独立事件.
(4)相互独立事件的性质
如果事件A与B相互独立,那么A与 ,与 B ,与 也都是相互独立的.
(5)如果一系列的事件A1,A2,…,An相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率的 积 ,即P(A1·A2·…·An)= P(A1)·P(A2)·…·P(An) .
4.χ2的计算公式及其特点
(1)根据2×2列联表与构造的随机变量χ2= (其中n=a+b+c+d是样本容量)来计算χ2的值.
(2)当数据量较大时,统计学中已有明确的结论,随机事件χ2≥x0发生的概率如下:
当χ2≤2.706时,没有 充分的证据 判定变量A、B有关联,可以认为变量A、B是 没有 关联的;
当χ2>2.706时,有 90% 的把握判定变量A、B有关联;
当χ2>3.841时,有 95% 的把握判定变量A、B有关联;
当χ2>6.635时,有 99% 的把握判定变量A、B有关联.
由于抽样的随机性,由样本得到的推断有可能 正确 ,也有可能 错误 .利用χ2进行独立性检验,可以对推断正确的概率做出估计,样本容量n越大,估计越 准确 .
题型1:
线性回归方程
已知关于某设备的使用年数x和支出的维修费用y(万元),由资料统计得5组数据(xi,yi)(i=1,2,3,4,5),由资料知y与x线性相关,并且由统计的五组数据得平均值分别为=4,=5.4,若用5组数据得到的线性回归方程y=bx+a去估计使用8年的维修费用比使用7年的维修费用多1.1万元.
(1)求回归直线方程;
(2)估计使用年数为10年时,维修费用约是多少.
【方法指导】回归
方程解方
程组列方
程组回归方程
过点(,),
【解析】
(1)因为直线y=bx+a经过定点(,),又=4,=5.4,所以5.4=4b+a,又8b+a-(7b+a)=1.1,解得b=1.1,a=1,所以回归方程为y=1.1x+1.
(2)将x=10代入线性回归方程得y=12.
所以,估计使用年数为10年时,维修费用约是12万元.
【小结】回归方程一定过中心点(,).本题运用方程的思想,采用待定系数法求解.线性回归方程类似于一次函数的解析式,故有问题可类比一次函数,将问题转化为求函数值.
题型2:
线性回归模型问题
一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表为抽样试验结果:
转速x(转/秒)
16
14
12
8
每小时生产有缺
点的零件数y(件)
11
9
8
5
(1)求变量y与x的相关系数,并对其相关性做出判断;
(2)如果y与x有线性相关关系,求回归直线方程;
(3)若在实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?
【方法指导】
(1)结论|r|与0.75
比较r的值,,,,xiyi
(2)y=bx+aa的值b的值
(3)y≤10➝bx+a≤10➝x的取值范围
【解析】
(1)=12.5,=8.25,xiyi=438,4=412.5,=660,=291,所以r===≈≈0.9954.
所以y与x有很强的线性相关关系.
(2)由
(1)可求得b=0.7286,a=-0.8571,所以y=0.7286x-0.8571.
(3)要使y≤10,得0.7286x-0.8571≤10,所以x≤14.901.
所以机器的转速应控制在14.901转/秒以下.
【小结】若能从散点图直观地判断相关关系,就利用散点图进行判断;若散点图不明显时,我们就要根据相关系数r进行判断.在求回归直线方程时学会合理进行运算很关键,为准确运算,可先列表求出相关数据,然后求解.
题型3:
非线性相关问题
某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:
x
1
2
3
5
10
20
30
50
100
200
y
10.15
5.52
4.08
2.85
2.11
1.62
1.41
1.30
1.21
1.15
检测每册书的成本费y与印刷册数的倒数之间是否具有线性相关关系.如有,求出y对x的回归方程.
【方法指导】本题是非线性回归分析问题,不妨设变量u=,题意要求对u与y作相关性检验,如果它们具有线性相关关系,就可以进一步求出y对u的回归直线方程,这时,再代回u=,就得到了y对x的回归曲线方程.
【解析】首先作变量置换u=,题目所给数据变成如下表所示的10对数据:
ui
1
0.5
0.33
0.2
0.1
0.05
0.03
0.02
0.01
0.005
yi
10.15
5.52
4.08
2.85
2.11
1.62
1.41
1.30
1.21
1.15
经计算得r=0.9998,从而认为u与y之间具有线性相关关系,由公式得a=1.125,b=8.973,
所以y=1.125+8.973u.
最后代入u=,可得y=1.125+.
【小结】在某些情况下可以借助于线性回归模型,研究呈现非线性相关关系的两个变量之间的关系,分析哪个模型拟合效果更好.
题型4:
相互独立事件的概率
甲、乙两人都进行一次射击,如果两人击中目标的概率都是0.8,两人之间相互没有影响.计算:
(1)两人都击中目标的概率;
(2)恰有一人击中目标的概率;
(3)至少有一人击中目标的概率.
【方法指导】
(1)P(AB)P(A)·P(B)P(A),P(B)
(2)P(A+B)P(A)·P()+P()·P(B)
(3)P=1-P()P()P()·P()
【解析】设“甲击中目标”记为事件A,“乙击中目标”记为事件B,A与B相互独立.
(1)两人各射击一次都击中目标即为事件AB,由事件A与B相互独立,得P(AB)=P(A)P(B)=0.8×0.8=0.64;
(2)P(A+B)=P(A)+P(B)=P(A)P()+P()·P(B)=0.8×0.2+0.2×0.8=0.32;
(3)P()=P()P()=(1-P(A))·(1-P(B))=(1-0.8)×(1-0.8)=0.04,1-P()=1-0.04=0.96.
【小结】把一个复杂的事件拆分成几个互斥或者相互独立的事件,是解决较为复杂概率问题的根本方法.
题型5:
独立性检验模型
为了考察某种药物预防疾病的效果,任选105只动物做试验,其中55只服用此种药,50只未服用此种药,之后发现服药的55只中有10只患病,未服药的50只动物中有20只患病,请判断此种药物是否有效.
【方法指导】结论χ2与临界
值比较求χ2的值作2×2
列联表
【解析】据题意做出列联表:
患病
未患病
总计
服用药
10
45
55
未服用药
20
30
50
总计
30
75
105
根据公式:
χ2=≈6.1>3.841.
所以我们有95%以上的把握判断该药物有效.
【小结】在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论可能犯错误,这是数学中的统计思维与确定性思维的不同之处,但我们可以利用统计分析的结果去预测实际问题的结果.用独立性检验的方法准确地判断两个变量的关联性,但要注意其一般步骤及准确计算.
1.(2014年·湖北卷)根据如下样本数据
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
得到的回归方程为=bx+a,则( ).
A.a>0,b>0 B.a>0,b<0
C.a<0,b>0D.a<0,b<0
【解析】作出散点图如下:
观察图像可知,回归直线=bx+a的斜率b<0,当x=0时,y=a>0.故a>0,b<0.
【答案】B
2.(2014年·江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ).
表1
成绩
性别
不及格
及格
总计
男
6
14
20
女
10
22
32
总计
16
36
52
表2
视力
性别
好
差
总计
男
4
16
20
女
12
20
32
总计
16
36
52
表3
智商
性别
偏高
正常
总计
男
8
12
20
女
8
24
32
总计
16
36
52
表4
阅读量
性别
丰富
不丰富
总计
男
14
6
20
女
2
30
32
总计
16
36
52
A.成绩 B.视力C.智商 D.阅读量
【解析】A中,a=6,b=14,c=10,d=22,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
χ2==.
B中,a=4,b=16,c=12,d=20,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
χ2==.
C中,a=8,b=12,c=8,d=24,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
χ2==.
D中,a=14,b=6,c=2,d=30,a+b=20,c+d=32,a+c=16,b+d=36,n=52,
χ2==.
∵<<<,
∴与性别有关联的可能性最大的变量是阅读量.
【答案】D
一、选择题
1.设某产品产量与产品单位成本之间的线性相关系数为-0.97,这说明二者之间存在着( ).
A.高度相关 B.中度相关
C.弱度相关D.极弱相关
【答案】A
2.设有回归直线方程y=2-1.5x,当变量x增加1个单位时( ).
A.y平均增加1.5个单位 B.y平均增加2个单位
C.y平均减少1.5个单位 D.y平均减少2个单位
【解析】设变量x增加1个单位后y变为y',则y'=2-1.5(x+1)=2-1.5x-1.5=y-1.5.
【答案】C
3.已知对一组观测值(xi,yi)作出散点图后,确定其具有线性相关关系.若对于y=bx+a,求得b=0.51,=61.75,=38.14,则回归直线方程为( ).
A.y=0.51x+6.6475B.y=6.6475x+0.51
C.y=0.51x+42.30D.y=42.30x+0.51
【答案】A
4.若事件M、N相互独立,则下列三个结论:
①M与相互独立;②N与相互独立;③与相互独立.其中正确的个数为( ).
A.0 B.1 C.2 D.3
【解析】由两个事件相互独立的概念可以判定.
【答案】D
5.某学校开展研究性学习活动,某同学获得一组实验数据如下表:
x
1.99
3
4
5.1
6.12
y
1.5
4.04
7.5
12
18.01
对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是( ).
A.y=2x-2B.y=()x
C.y=log2xD.y=(x2-1)
【解析】将给定的点代入比较即可.
【答案】D
6.下面是一个2×2列联表:
y1
y2
总计
x1
a
21
73
x2
c
d
27
总计
b
46
则表中a+b+c+d等于( ).
A.125B.128C.133D.147
【解析】∵a+21=73,∴a=52,又由b+46=73+27,知b=54.∵c+d=27,∴a+b+c+d=133.
【答案】C
7.在研究变量x和y的线性相关性时,甲、乙二人分别做了研究,利用最小二乘法得到线性回归方程l1和l2,两人计算的相同,也相同,下列说法正确的是( ).
A.l1与l2重合
B.l1与l2一定平行
C.l1与l2相交于点(,)
D.无法判断l1和l2是否相交
【解析】回归直线方程过点(,).
【答案】C
8.设有一个回归方程y=3-3.5x,若变量x增加一个单位,则( ).
A.y平均增加3.5个单位
B.y平均增加3个单位
C.y平均减少3.5个单位
D.y平均减少3个单位
【解析】x的系数为-3.5,所以减少.
【答案】C
9.某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的2×2列联表:
做不到“光盘”
能做到“光盘”
男
45
10
女
30
15
得到的正确结论是( ).
A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”
D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”
【解析】χ2=≈3.030,因为χ2>2.706,所以说有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.
【答案】C
10.某道路的A、B、C三处都设有交通灯,这三盏灯在一分钟内开放绿灯的时间分别为25秒、35秒、45秒,某辆车在这条路上行驶时,三处都不停车的概率是( ).
A.B.C.D.
【解析】××=.
【答案】A
二、填空题
11.有下列关系:
(1)人的年龄与他(她)的身高之间的关系;
(2)圆的体积与半径之间的关系;
(3)直线上的点与该点的坐标之间的关系.
其中有相关关系的是 (填写你认为正确的序号).
【答案】
(1)
12.从散点图上看,点散布在从左下角到右上角的区域内,则两个变量的这种相关关系称为 .
【答案】正相关
13.对四对变量y与x进行相关性检验,已知n是观测值的组数,r是相关系数.且已知:
(1)n=7,r=0.9533;
(2)n=15,r=0.3012;
(3)n=17,r=0.4991;(4)n=3,r=0.9950.
则变量y与x的线性关系很强的是 .
【解析】统计学中常用相关系数r来衡量两个变量之间线性关系的强弱,|r|≤1,|r|越接近于1,则y与x的线性关系越强.
【答案】
(1)(4)
14.已知随机事件A的概率P(A)=0.5,事件B的概率P(B)=0.6,事件AB的概率P(AB)=0.4,则条件概率P(B|A)= .
【解析】P(B|A)===0.8.
【答案】0.8
15.幂函数曲线y=axb,作变换u=lny,v=lnx,c=lna,得线性函数 .
【解析】将u=lny,v=lnx,c=lna代入y=axb,消去x、y得u=c+bv.
【答案】u=c+bv
三、解答题
16.因冰雪灾害,某柑橘基地果树严重受损,为此有关专家提出一种拯救果树的方案,该方案需分两年实施且相互独立.该方案预计第一年可以使柑橘产量恢复到灾前的1.0、0.9、0.8的概率分别为0.2、0.4、0.4;第二年可以使柑橘产量为第一年产量的1.5倍、1.25倍、1.0倍的概率分别是0.3、0.3、0.4.
(1)求两年后柑橘产量恰好达到灾前产量的概率;
(2)求两年后柑橘产量超过灾前产量的概率.
【解析】
(1)令A表示两年后柑橘产量恰好达到灾前产量这一事件,则P(A)=0.2×0.4+0.4×0.3=0.2.
(2)令B表示两年后柑橘产量超过灾前产量这一事件,则P(B)=0.2×0.6+0.4×0.6+0.4×0.3=0.48.
17.某工厂积极响应节能减排的号召,经过技术改造后,降低了能源消耗,下表提供了该厂记录的某种产品的产量x(吨)与相应的生产能耗y(吨)的几组样本数据:
x
3
4
5
6
y
2.5
3
4
4.5
根据相关性检验,这组样本数据具有线性相关关系.
(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;
(2)已知该厂技改前100吨此种产品的生产能耗为90吨.试根据求出的线性回归方程,预测生产100吨此产品的生产能耗比技改前降低多少吨?
【解析】
(1)==4.5,==3.5,=86,xiyi=66.5,
b===0.7,a=-b=3.5-0.7×4.5=0.35.
故线性回归方程为y=0.7x+0.35.
(2)根据回归方程预测生产100吨产品消耗的能耗约为0.7×100+0.35=70.35.故耗能减少了90-70.35=19.65吨.
18.企业为了研究员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,其中积极支持企业改革的调查者中,工作积极的有54人,工作一般的有32人,而不太赞成企业改革的调查者中,工作积极的有40人,工作一般的有63人.
(1)根据以上的数据建立一个2×2列联表;
(2)对于人力资源部的研究项目,根据以上数据是否可以认为企业的全体员工对待企业改革的态度与其工作积极性有关系?
【解析】
(1)
积极支持企业改革
不太赞成企业改革
总计
工作积极
54
40
94
工作一般
32
63
95
总计
86
103
189
(2)由公式得χ2=≈10.759,
因为10.759>6.635,所以有99%以上的把握说抽样员工对待企业改革的态度与工作积极性是有关的,也可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.
19.某地最近十年粮食需求量逐年上升,下表是部分统计数据:
年份
2006
2008
2010
2012
2014
需求量(万吨)
236
246
257
276
286
(1)利用所给数据求年需求量与年份之间的回归直线方程y=bx+a;
(2)利用
(1)中所求出的直线方程预测该地2016年的粮食需求量.
【解析】
(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归直线方程,为此对数据预处理如下:
年份—2010
-4
-2
0
2
4
需求量—257
-21
-11
0
19
29
对预处理后的数据,容易算得
=0,=3.2,
b==6.5,a=-b=3.2.
由上述计算结果,知所求回归直线方程为:
y-257=b(x-2010)+a=6.5(x-2010)+3.2,
即y=6.5x-12804.8.
(2)利用回归直线方程,可预测2016年的粮食需求量约为
6.5×(2016-2010)+260.2=6.5×6+260.2=299.2万吨.
20.某市工薪阶层关于“延迟退休年龄”的态度进行调查,随机抽调了50人,他们月收入的频数分布及对“延迟退休年龄”反对人数如下表:
月收入
(元)
[1000,
2000)
[2000,
3000)
[3000,
4000)
[4000,
5000)
[5000,
6000)
[6000,
7000)
频数
5
10
15
10
5
5
反对人数
4
8
12
5
2
1
(1)由以上统计数据填下面2×2列联表并问分析“月收入以5000为分界点”对“延迟退休年龄”的态度是否有差异?
月收入不低于
5000元的人数
月收入低于
5000元的人数
合计
反对
x=
m=
赞成
y=
n=
合计
(2)若参加此次调查的人中,有9人为公务员,现在要从这9人中,随机选出2人统计调查结果,其中a、b恰为统计局工作人员,求两人至少有1人入选的概率.
【解析】
(1)2×2列联表
月收入不低于
5000元的人数
月收入低于
5000元的人数
合计
反对
x=3
m=29
32
赞成
y=7
n=11
18
合计
10
40
50
χ2=≈6.27>3.841.
所以有95%以上的把握认为“月收入以5000为分界点”对“延迟退休年龄”的态度有差异.
(2)设9人分别为a,b,c,d,e,f,g,h,k,则选出的2人所有可能的情况为:
ab,ac,ad,ae,af,ag,ah,ak;bc,bd,be,bf,bg,bh,bk;cd,ce,cf,cg,ch,ck;de,df,dg,dh,dk;ef,eg,eh,ek;fg,fh,fk;gh,gk;hk.共36种,
其中a、b至少有1人入选的情况有15种,∴a、b两人至少有1人入选的概率为P==.
21.某种电路开关闭合后,会出现红灯或绿灯闪动.已知开关第一次闭合后,出现红灯和绿灯的概率都是,从开关第二次闭合起,若前一次出现红灯,则下一次出现红灯的概率是,出现绿灯的概率是;若前一次出现绿灯,则下一次出现红灯的概率是,出现绿灯的概率是.
(1)第二次闭合后出现红灯的概率是多少?
(2)前三次发光中,出现一次红灯、两次绿灯的概率是多少?
【解析】
(1)概率P1=P(红红)+P(绿红)
=×+×=.
(2)概率P2=P(红绿绿)+P(绿红绿)+P(绿绿红)
=××+××+××=.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高中数学北师大版选修12精品学案第一章 统计案例 章末小结 高中数学 北师大 选修 12 精品 第一章 统计 案例 小结