高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理.docx
- 文档编号:11979119
- 上传时间:2023-04-16
- 格式:DOCX
- 页数:18
- 大小:220.68KB
高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理.docx
《高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理.docx》由会员分享,可在线阅读,更多相关《高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理.docx(18页珍藏版)》请在冰豆网上搜索。
高考数学考点通关练第八章概率与统计67变量间的相关关系与统计案例试题理
考点测试67 变量间的相关关系与统计案例
一、基础小题
1.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A.=-2x+100B.=2x+100
C.=-2x-100D.=2x-100
答案 A
解析 B、D为正相关,C中值恒为负,不符合题意.
2.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x/万元
4
2
3
5
销售额y/万元
49
26
39
54
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元B.65.5万元
C.67.7万元D.72.0万元
答案 B
解析 ∵=-=-9.4×=9.1,∴回归方程为=9.4x+9.1.令x=6,得=9.4×6+9.1=65.5(万元).
3.设某大学的女生体重y(单位:
kg)与身高x(单位:
cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1cm,则其体重约增加0.85kg
D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg
答案 D
解析 由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确.又线性回归方程必过样本点中心(,),因此B正确.由线性回归方程中系数的意义知,x每增加1cm,其体重约增加0.85kg,故C正确.当某女生的身高为170cm时,其体重估计值是58.79kg,而不是具体值,因此D不正确.
4.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1B.0C.D.1
答案 D
解析 样本点都在直线上时,其数据的估计值与真实值是相等的,即yi=i,代入相关系数公式r==1.
5.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )
A.直线l过点(,)
B.x和y的相关系数为直线l的斜率
C.x和y的相关系数在0到1之间
D.当n为偶数时,分布在l两侧的样本点的个数一定相同
答案 A
解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以B、C错误;D中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以D错误;根据线性回归直线一定经过样本点中心可知A正确.
6.在一次对性别与说谎是否相关的调查中,得到如下数据:
说谎
不说谎
合计
男
6
7
13
女
8
9
17
合计
14
16
30
根据表中数据,得到如下结论中正确的一项是( )
A.在此次调查中有95%的把握认为是否说谎与性别有关
B.在此次调查中有99%的把握认为是否说谎与性别有关
C.在此次调查中有99.5%的把握认为是否说谎与性别有关
D.在此次调查中没有充分的证据显示说谎与性别有关
答案 D
解析 由于K2=≈0.0024,由于K2很小,因此,在此次调查中没有充分的证据显示说谎与性别有关.故选D.
7.如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.
答案 D
解析 由散点图知呈带状区域时有较强的线性相关关系,故去掉D.
8.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:
又发作过心脏病
未发作过心脏病
合计
心脏搭桥手术
39
157
196
血管清障手术
29
167
196
合计
68
324
392
试根据上述数据计算K2=________.
根据表中所给的数据,能否在犯错误的概率不超过0.15的前提下认为这两种手术对病人又发作过心脏病的影响有差别?
________________________________________________________________________.
答案 1.779 不能作出这两种手术对病人又发作心脏病的影响有差别的结论
解析 根据列联表中的数据,
可以求得K2=≈1.779,而K2<2.072,
所以我们不能在犯错误的概率不超过0.15的前提下,作出这两种手术对病人又发作心脏病的影响有差别的结论.
二、高考小题
9.[2015·全国卷Ⅱ]根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:
万吨)柱形图,以下结论中不正确的是( )
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
答案 D
解析 由柱形图,知2006年以来我国二氧化硫年排放量呈减少趋势,故其排放量与年份负相关,故D错误.
10.[2015·福建高考]为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元B.11.8万元
C.12.0万元D.12.2万元
答案 B
解析 ∵==10,
==8,
∴=-0.76=8-0.76×10=0.4,
∴=0.76x+0.4.
当x=15时,=0.76×15+0.4=11.8.
11.[2014·江西高考]某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
表1
成绩
性别
不及格
及格
总计
男
6
14
20
女
10
22
32
总计
16
36
52
表2
视力
性别
好
差
总计
男
4
16
20
女
12
20
32
总计
16
36
52
表3
智商
性别
偏高
正常
总计
男
8
12
20
女
8
24
32
总计
16
36
52
表4
阅读量
性别
丰富
不丰富
总计
男
14
6
20
女
2
30
32
总计
16
36
52
A.成绩B.视力C.智商D.阅读量
答案 D
解析 根据K2=,代入题中数据计算得
表1:
K2=≈0.009;
表2:
K2=≈1.769;
表3:
K2=≈1.3;
表4:
K2=≈23.48.
∵D选项K2最大,
∴阅读量与性别有关联的可能性最大,故选D.
12.[2014·湖北高考]根据如下样本数据
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
得到的回归方程为=bx+a,则( )
A.a>0,b>0B.a>0,b<0
C.a<0,b>0D.a<0,b<0
答案 B
解析 把样本数据中的x,y分别当作点的横、纵坐标,在平面直角坐标系xOy中作出散点图,由图可知b<0,a>0.故选B.
13.[2014·重庆高考]已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是( )
A.=0.4x+2.3B.=2x-2.4
C.=-2x+9.5D.=-0.3x+4.4
答案 A
解析 由变量x与y正相关知C、D均错,又回归直线经过样本中心(3,3.5),代入验证得A正确,B错误.故选A.
三、模拟小题
14.[2017·大连双基测试]已知x,y的取值如表所示:
x
2
3
4
y
6
4
5
如果y与x线性相关,且线性回归方程为=x+,则的值为( )
A.-B.C.-D.
答案 A
解析 将=3,=5代入到=x+中,得=-.故选A.
15.[2016·兰州、张掖联考]对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,…,8),其回归直线方程是=x+,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,则实数的值是( )
A.B.C.D.
答案 B
解析 依题意可知样本中心点为,则=×+a,解得=.
16.[2016·漳州二模]下列说法错误的是( )
A.在回归模型中,预报变量y的值不能由解释变量x唯一确定
B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好
答案 B
解析 对于A,在回归模型中,预报变量y的值由解释变量x和随机误差e共同确定,即x只能解释部分y的变化,∴A正确;对于B,线性回归分析中,相关系数r的绝对值越接近1,两个变量的线性相关性越强,反之,线性相关性越弱,∴B错误;对于C,在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,C正确;对于D,在回归分析中,用相关指数R2来刻画回归的效果时,R2取值越大,说明模型拟合的效果越好,∴R2为0.98的模型比R2为0.80的模型拟合的效果好,D正确.故选B.
17.[2017·温州月考]为了检验某套眼保健操预防学生近视的作用,把500名做该套眼保健操的学生与另外500名未做该套眼保健操的学生的视力情况作记录并比较,提出假设H0:
“这套眼保健操不能起到预防近视的作用”,利用2×2列联表计算所得的K2≈3.918.经查对临界值表知P(K2≥3.841)≈0.05.对此,四名同学得出了以下结论:
①有95%的把握认为“这套眼保健操能起到预防近视的作用”;②若某人未做该套眼保健操,那么他有95%的可能得近视;③这套眼保健操预防近视的有效率为95%;④这套眼保健操预防近视的有效率为5%.
其中所有正确结论的序号是________.
答案 ①
解析 根据查对临界值表知P(K2≥3.841)≈0.05,故有95%的把握认为“这套眼保健操能起到预防近视的作用”,即①正确;95%仅是指“这套眼保健操能起到预防近视的作用”的可信程度,所以②③④错误.
18.[2016·兰州一模]从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:
千元)与月储蓄yi(单位:
千元)的数据资料,计算得i=80,i=20,iyi=184,=720.已知家庭的月储蓄y关于月收入x的线性回归方程为=x+,则变量x与y________(填“正相关”或“负相关”);若该居民区某家庭月收入为7千元,预测该家庭的月储蓄是________千元.
答案 正相关 1.7
解析 由题意,知n=10,=i=8,=i=2,∴==0.3,=2-0.3×8=-0.4,
∴=0.3x-0.4,∵0.3>0,∴变量x与y正相关.当x=7时,=0.3×7-0.4=1.7(千元).
一、高考大题
1.[2016·全国卷Ⅲ]下图是我国2008年至2014年生活垃圾无害化处理量(单位:
亿吨)的折线图.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:
yi=9.32,tiyi=40.17,=0.55,≈2.646.
参考公式:
相关系数r=,
回归方程=+t中斜率和截距的最小二乘估计公式分别为:
=,=-.
解
(1)由折线图中数据和附注中参考数据得
=4,(ti-)2=28,=0.55,
(ti-)(yi-)=tiyi-yi
=40.17-4×9.32=2.89,
r≈≈0.99.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
(2)由=≈1.331及
(1)得==≈0.103,
=-=1.331-0.103×4≈0.92.
所以y关于t的回归方程为=0.92+0.10t.
将2016年对应的t=9代入回归方程得
=0.92+0.10×9=1.82.
所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.
2.[2015·全国卷Ⅰ]某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:
千元)对年销售量y(单位:
t)和年利润z(单位:
千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
(xi-)2
(wi-)2
(xi-)(yi-)
(wi-)(yi-)
46.6
563
6.8
289.8
1.6
1469
108.8
表中wi=,=wi.
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?
(给出判断即可,不必说明理由)
(2)根据
(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据
(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:
对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为
=,=-.
解
(1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)令w=,先建立y关于w的线性回归方程.
由于===68,
=-=563-68×6.8=100.6,
所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.
(3)①由
(2),知当x=49时,年销售量y的预报值
=100.6+68=576.6,
年利润z的预报值
=576.6×0.2-49=66.32.
②根据
(2)的结果,知年利润z的预报值
=0.2×(100.6+68)-x=-x+13.6+20.12,
所以当==6.8,即x=46.24时,取得最大值,
故年宣传费为46.24千元时,年利润的预报值最大.
二、模拟大题
3.[2016·石家庄模拟]班主任对班级22名学生进行了作业量多少的调查,数据如下:
在喜欢玩电脑游戏的12人中,有10人认为作业多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多.
(1)根据以上数据建立一个2×2列联表;
(2)试问喜欢玩电脑游戏与认为作业多少是否有关系.
参考公式:
K2=,其中n=a+b+c+d.
参考数据:
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
解
(1)根据题中所给数据,得到如下列联表:
认为作业多
认为作业不多
总计
喜欢玩
电脑游戏
10
2
12
不喜欢玩
电脑游戏
3
7
10
总计
13
9
22
(2)K2=≈6.418,
∵3.841<6.418,
∴有95%的把握认为喜欢玩电脑游戏与认为作业多少有关.
4.[2016·广东模拟]2016年1月1日起全国统一实施全面两孩政策,为了解适龄民众对放开生育二胎政策的态度,某市选取70后和80后作为调查对象,随机调查了100位,得到数据如下表:
生二胎
不生二胎
合计
70后
30
15
45
80后
45
10
55
合计
75
25
100
(1)以这100个人的样本数据估计该市的总体数据,且以频率估计概率,若从该市70后公民中随机抽取3位,记其中生二胎的人数为X,求随机变量X的分布列和数学期望;
(2)根据调查的数据,是否有90%以上的把握认为“生二胎与年龄有关”,并说明理由.
参考公式:
K2=,其中n=a+b+c+d
参考数据:
P(K2≥k)
0.15
0.10
0.05
0.025
0.010
0.005
k
2.072
2.706
3.841
5.024
6.635
7.879
解
(1)由已知得70后“生二胎”的概率为,
并且X~B,
所以P(X=k)=Ck3-k(k=0,1,2,3),
其分布列如下:
X
0
1
2
3
P
所以E(X)=3×=2.
(2)K2=
=
=≈3.030>2.706,
所以有90%以上的把握认为“生二胎与年龄有关”.
5.[2017·成都诊断]PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:
时间
周一
周二
周三
周四
周五
车流量x(万辆)
100
102
108
114
116
浓度y(微克/立方米)
78
80
84
88
90
(1)根据上表数据,用最小二乘法求出y与x的线性回归方程;
(2)若周六同一时段车流量是200万辆,试根据
(1)求出的线性回归方程,预测此时PM2.5的浓度为多少?
参考公式:
=,=-·.
解
(1)由条件可知=i==108,
=i==84,
(xi-)(yi-)=(-8)×(-6)+(-6)×(-4)+0×0+6×4+8×6=144,
(xi-)2=(-8)2+(-6)2+02+62+82=200,
===0.72,
=-=84-0.72×108=6.24,
故y关于x的线性回归方程为=0.72x+6.24.
(2)当x=200时,=0.72×200+6.24=150.24.
所以可以预测此时PM2.5的浓度约为150.24微克/立方米.
6.[2017·厦门质检]某单位共有10名员工,他们某年的收入如下表:
员工编号
1
2
3
4
5
6
7
8
9
10
年薪(万元)
3
3.5
4
5
5.5
6.5
7
7.5
8
50
(1)求该单位员工当年年薪的平均值和中位数;
(2)从该单位中任取2人,此2人中年薪高于5万的人数记为ξ,求ξ的分布列和期望;
(3)已知员工年薪与工作年限成正线性相关关系,若某员工工作第一年至第四年的年薪分别为3万元、4.2万元、5.6万元、7.2万元,预测该员工第五年的年薪为多少.
附:
线性回归方程=x+中系数计算公式=,=-,其中,表示样本均值.
解
(1)平均值为10万元,中位数为6万元.
(2)年薪高于5万的有6人,低于或等于5万的有4人,所以从该单位中任取2人,此2人中年薪高于5万的人数记为ξ,ξ的可能取值为0,1,2.
P(ξ=0)==,P(ξ=1)==,
P(ξ=2)==,
所以ξ的分布列为:
ξ
0
1
2
P
E(ξ)=0×+1×+2×=.
(3)设xi,yi(i=1,2,3,4)分别表示工作年限及相应年薪,则=2.5,=5,
(xi-)2=2.25+0.25+0.25+2.25=5,
(xi-)(yi-)=-1.5×(-2)+(-0.5)×(-0.8)+0.5×0.6+1.5×2.2=7,
===1.4,
=-=5-1.4×2.5=1.5,
所以线性回归方程为=1.4x+1.5.
当x=5时,=8.5.
故可预测该员工第五年的年薪为8.5万元.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高考 数学 考点 通关 第八 概率 统计 67 变量 相关 关系 案例 试题