高考数学理复习专题限时集训7 回归分析独立性检验含答案.docx
- 文档编号:2036079
- 上传时间:2022-10-26
- 格式:DOCX
- 页数:12
- 大小:183.99KB
高考数学理复习专题限时集训7 回归分析独立性检验含答案.docx
《高考数学理复习专题限时集训7 回归分析独立性检验含答案.docx》由会员分享,可在线阅读,更多相关《高考数学理复习专题限时集训7 回归分析独立性检验含答案.docx(12页珍藏版)》请在冰豆网上搜索。
高考数学理复习专题限时集训7回归分析独立性检验含答案
专题限时集训(七) 回归分析、独立性检验
(对应学生用书第91页)
(限时:
40分钟)
题型1 回归分析
1,3,5,6,7,9,10,11,12,14
题型2 独立性检验
2,4,8,13
一、选择题
1.(2017·石家庄一模)下列说法错误的是( )
【07804050】
A.回归直线过样本点的中心(,)
B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1
C.对分类变量X与Y,随机变量K2的观测值k越大,则判断“X与Y有关系”的把握程度越小
D.在回归直线方程=0.2x+0.8中,当解释变量x每增加1个单位时,预报变量就增加0.2个单位
C [根据相关定义知选项A,B,D均正确;选项C中,对分类变量X与Y,随机变量K2的观测值k越大,对判断“X与Y有关系”的把握程度越大,故C错误.选C.]
2.(2017·湖南名校联考)利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定“X和Y有关系”的可信度.如果k>3.841,那么有把握认为“X和Y有关系”的百分比为
P(K2>k0)
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.5% B.75%
C.99.5%D.95%
D [由图表中数据可得,当k>3.841时,有0.05的几率说明这两个变量之间的关系是不可信的,即有1-0.05=0.95的几率,也就是有95%的把握认为变量之间有关系,故选D.]
3.(2017·湖北七市联考)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x和销售额y进行统计,得到统计数据如下表(单位:
万元):
广告费x
2
3
4
5
6
销售额y
29
41
50
59
71
由上表可得回归方程为=10.2x+,据此模型,预测广告费为10万元时销售额约为( )
【07804051】
A.101.2万元B.108.8万元
C.111.2万元D.118.2万元
C [根据统计数据表,可得=×(2+3+4+5+6)=4,=×(29+41+50+59+71)=50,而回归直线=10.2x+经过样本点的中心(4,50),∴50=10.2×4+,解得=9.2,∴回归方程为=10.2x+9.2,∴当x=10时,=10.2×10+9.2=111.2,故选C.]
4.(2017·佛山二模)现行普通高中学生在高一升高二时面临着选文理科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如图77所示的两个等高堆积条形图.
图77
根据这两幅图中的信息,下列哪个统计结论是不正确的( )
A.样本中的女生数量多于男生数量
B.样本中有理科意愿的学生数量多于有文科意愿的学生数量
C.样本中的男生偏爱理科
D.样本中的女生偏爱文科
D [由图2知,样本中的女生数量多于男生数量,样本中的男生、女生均偏爱理科;由图1知,样本中有理科意愿的学生数量多于有文科意愿的学生数量,故选D.]
5.(2016·汕头模拟)对四组不同数据进行统计,分别获得以下散点图,如果对它们的相关系数进行比较,下列结论中正确的是( )
图78
(1)
图78
(2)
图78(3)
图78(4)
A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3
A [由给出的四组数据的散点图可以看出,图
(1)和图(3)是正相关,相关系数大于0,图
(2)和图(4)是负相关,相关系数小于0,图
(1)和图
(2)的点相对更加集中,所以相关性要强,所有r1接近于1,r2接近于-1,由此可得r2<r4<r3<r1.故选A.]
6.(2017·南昌一模)设某中学的高中女生体重y(单位:
kg)与身高x(单位:
cm)具有线性相关关系,根据样本数据(xi,yi)(i=1,2,3,…,n),用最小二乘法近似得到回归直线方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正线性相关关系
B.回归直线过样本点的中心(,)
C.若该中学某高中女生身高增加1cm,则其体重约增加0.85kg
D.若该中学某高中女生身高为160cm,则可断定其体重必为50.29kg
D [因为回归直线方程=0.85x-85.71中x的系数为0.85>0,因此y与x具有正线性相关关系,所以选项A正确;由最小二乘法及回归直线方程的求解可知回归直线过样本点的中心(,),所以选项B正确;由于用最小二乘法得到的回归直线方程是估计值,而不是具体值,若该中学某高中女生身高增加1cm,则其体重约增加0.85kg,所以选项C正确,选项D不正确.]
7.在用线性回归方程研究四组数据的拟合效果中,分别作出下列四个关于四组数据的残差图,则用线性回归模式拟合效果最佳的是( )
C [当残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明拟合精度越好,拟合效果越好,对比4个残差图,易知选项C的图对应的带状区域的宽度越窄.故选C.]
8.(2017·江西南城一中、高安中学第九校3月联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
非一线
一线
合计
愿生
45
20
65
不愿生
13
22
35
合计
58
42
100
由K2=,得K2=≈9.616.
参照下表,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
正确的结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
C [K2≈9.616>6.635,
∴有99%以上的把握认为“生育意愿与城市级别有关”,故选C.]
二、填空题
9.(2017·汉中二模)为了研究某种细菌在特定环境下随时间变化的繁殖规律,得到了下表中的实验数据,计算得回归直线方程为=0.85x-0.25.由以上信息,可得表中c的值为________.
【07804052】
天数x
3
4
5
6
7
繁殖数量y(千个)
2.5
3
4
4.5
c
6 [==5,==,代入回归直线方程,得=0.85×5-0.25,解得c=6.]
10.(2017·安徽百校联盟二模)已知x、y的取值为:
x
1
2
3
4
5
y
5
6
7
8
10
从散点图可知y与x呈线性相关关系,且回归直线方程为=1.2x+,则当x=20时,y的取值为________.
27.6 [由表格可知=3,=7.2,所以这组数据的样本点的中心是(3,7.2),根据样本点的中心在回归直线上,得7.2=+1.2×3,得=3.6,所以这组数据对应的回归直线方程是=1.2x+3.6,将x=20代入,得y=1.2×20+3.6=27.6.]
11.(2017·山西太原五中一模)某小卖部销售某品牌的饮料的零售价与销量间的关系统计如下:
单价x(元)
3.0
3.2
3.4
3.6
3.8
4.0
销量y(瓶)
50
44
43
40
35
28
已知x,y的关系符合回归方程=x+,其中=-20.若该品牌的饮料的进价为2元,为使利润最大,零售价应定为________元.
3.75 [=3.5,=40,
∴=40-(-20)×3.5=110,
∴回归直线方程为:
=-20x+110,
利润L=(x-2)(-20x+110)=-20x2+150x-220,
∴x==3.75元时,利润最大,
故答案为3.75.]
12.(2017·哈尔滨三中二模)以模型y=cekx(e为自然对数的底)去拟合一组数据时,为了求出回归直线方程,设z=lny,其变换后得到线性回归方程为z=0.4x+2,则c=________.
e2 [∵y=cekx,
∴两边取对数,可得lny=ln(cekx)=lnc+lnekx=lnc+kx,
令z=lny,可得z=lnc+kx,
∵z=0.4x+2,
∴lnc=2,
∴c=e2.]
三、解答题
13.(2017·石家庄一模)为了调查某地区成年人血液的一项指标,现随机抽取了成年男性、女性各20人组成一个样本,对他们的这项血液指标进行了检测,得到了如图79所示的茎叶图.根据医学知识,我们认为此项指标大于40为偏高,反之即为正常.
图79
(1)依据上述样本数据研究此项血液指标与性别的关系,列出2×2列联表,并判断能否在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系?
(2)以样本估计总体,视样本频率为概率,现从本地区随机抽取成年男性、女性各2人,求此项血液指标为正常的人数X的分布列及数学期望.
附:
K2=,其中n=a+b+c+d.
P(K2≥k0)
0.025
0.010
0.005
k0
5.024
6.635
7.879
[解]
(1)由茎叶图可得2×2列联表:
正常
偏高
合计
男性
16
4
20
女性
12
8
20
合计
28
12
40
K2==≈1.905<6.635,
所以不能在犯错误的概率不超过0.01的前提下认为此项血液指标与性别有关系.
(2)由样本数据可知,男性正常的概率为,女性正常的概率为.
此项血液指标为正常的人数X的可能取值为0,1,2,3,4,
P(X=0)==,
P(X=1)=C+C·=,
P(X=2)=+C·C·+=,
P(X=3)=C+C·=,
P(X=4)==,
所以X的分布列为
X
0
1
2
3
4
P
所以E(X)=0×+1×+2×+3×+4×=2.8.
14.(2017·湖南三湘名校联盟三模)为了研究一种昆虫的产卵数y和温度x是否有关,现收集了7组观测数据列于下表中,并作出了散点图,发现样本点并没有分布在某个带状区域内,两个变量并不呈线性相关关系,现分别用模型①:
y=C1x2+C2与模型②:
y=eC3x+C4作为产卵数y和温度x的回归方程来建立两个变量之间的关系.
温度x/℃
20
22
24
26
28
30
32
产卵数y/个
6
10
21
24
64
113
322
t=x2
400
484
576
676
784
900
1024
z=lny
1.79
2.30
3.04
3.18
4.16
4.73
5.77
26
692
80
3.57
1157.54
0.43
0.32
0.00012
其中ti=x,=ti,zi=lnyi,=zi,
附:
对于一组数据(u1,v1),(u2,v2)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高考数学理复习专题限时集训7 回归分析独立性检验含答案 高考 学理 复习 专题 限时 集训 回归 分析 独立性 检验 答案