第4课时线性回归分析与统计案例整理.docx
- 文档编号:1939045
- 上传时间:2022-10-25
- 格式:DOCX
- 页数:16
- 大小:201.79KB
第4课时线性回归分析与统计案例整理.docx
《第4课时线性回归分析与统计案例整理.docx》由会员分享,可在线阅读,更多相关《第4课时线性回归分析与统计案例整理.docx(16页珍藏版)》请在冰豆网上搜索。
第4课时线性回归分析与统计案例整理
第4课时线性回归分析与统计案例
1.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r如下表:
甲
乙
丙
丁
r
-0.82
-0.78
-0.69
-0.85
则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )
A.甲 B.乙
C.丙D.丁
答案 D
2.(2018·湖北七市联考)广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费x和销售额y进行统计,得到统计数据如下表(单位:
万元):
广告费x
2
3
4
5
6
销售额y
29
41
50
59
71
由上表可得回归方程为=10.2x+,据此模型,预测广告费为10万元时销售额约为( )
A.101.2万元B.108.8万元
C.111.2万元D.118.2万元
答案 C
解析 根据统计数据表,可得=×(2+3+4+5+6)=4,=×(29+41+50+59+71)=50,而回归直线=10.2x+经过样本点的中心(4,50),∴50=10.2×4+,解得=9.2,∴回归方程为=10.2x+9.2,∴当x=10时,=10.2×10+9.2=111.2,故选C.
3.(2018·赣州一模)以下四个命题:
①从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;
②两个随机变量相关性越强,则相关系数的绝对值越接近于1;
③在回归直线方程=0.2x+12中,当解释变量x每增加1个单位时,预报变量平均增加0.2个单位;
④分类变量X与Y,对它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.
其中真命题为( )
A.①④B.②④
C.①③D.②③
答案 D
解析 ①为系统抽样;④分类变量X与Y,对它们的随机变量K2的观测值k来说,k越大,“X与Y有关系”的把握程度越大.
4.下面是一个2×2列联表
y1
y2
总计
x1
a
21
73
x2
22
25
47
合计
b
46
120
其中a,b处填的值分别为( )
A.94 72B.52 50
C.52 74D.74 52
答案 C
解析 由a+21=73,得a=52,a+22=b,得b=74.故选C.
5.(2018·湖南衡阳联考)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )
A.甲B.乙
C.丙D.丁
答案 D
解析 r越大,m越小,线性相关性越强.故选D.
6.(2018·衡水中学调研)以下四个命题中,真命题是( )
A.对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y有关系”的把握程度越大
B.两个随机变量的线性相关性越强,相关系数的绝对值越接近于0
C.若数据x1,x2,x3,…,xn的方差为1,则2x1,2x2,2x3,…,2xn的方差为2
D.在回归分析中,可用相关指数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好
答案 D
解析 对于A,对分类变量x与y的随机变量K2的观测值k来说,k越大,判断“x与y有关系”的把握程度越大,故A错误;对于B,两个随机变量的线性相关性越强,相关系数的绝对值越接近于1,故B错误;对于C,若数据x1,x2,x3,…,xn的方差为1,则2x1,2x2,2x3,…,2xn的方差为4,故C错误;对于D,根据离散变量的线性相关及相关指数的有关知识可知D正确.
7.2015年年度史诗大剧《芈月传》风靡大江南北,影响力不亚于以前的《甄嬛传》.某记者调查了大量《芈月传》的观众,发现年龄段与爱看的比例存在较好的线性相关关系,年龄在[10,14],[15,19],[20,24],[25,29][30,34]的爱看比例分别为10%,18%,20%,30%,t%.现用这5个年龄段的中间值代表年龄段,如12代表[10,14],17代表[15,19],根据前四个数据求得爱看比例y关于x的线性回归方程为y=(kx-4.68)%,由此可推测t的值为( )
A.33B.35
C.37D.39
答案 B
解析 依题意,x=×(12+17+22+27)=19.5,
y=×(10%+18%+20%+30%)=19.5%,
又∵回归直线必过点(x,y),∴19.5%=(k×19.5-4.68)%,解得k=,∴当x=32时,(×32-4.68)%=35%,∴t≈35.
8.(2018·广西南宁月考)某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下列联表:
偏爱蔬菜
偏爱肉类
合计
50岁以下
4
8
12
50岁以上
16
2
18
合计
20
10
30
则可以说其亲属的饮食习惯与年龄有关的把握为( )
附:
K2=.
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.90%B.95%
C.99%D.99.9%
答案 C
解析 由2×2列联表知,K2==10.∵K2>6.635,K2<10.828,∴有99%的把握认为其亲属的饮食习惯与年龄有关.
9.2017世界特色魅力城市200强新鲜出炉,包括黄山市在内的28个中国城市入选,美丽的黄山风景和人文景观迎来众多宾客.现在很多人喜欢“自助游”,某调查机构为了了解“自助游”是否与性别有关,在黄山旅游节期间,随机抽取了100人,得如下所示的列联表:
赞成“自助游”
不赞成“自助游”
合计
男性
30
15
45
女性
45
10
55
合计
75
25
100
参照公式,得到的正确结论是( )
A.有99.5%以上的把握认为“赞成‘自助游’与性别无关”
B.有99.5%以上的把握认为“赞成‘自助游’与性别有关”
C.在犯错误的概率不超过0.1的前提下,认为“赞成‘自助游’与性别无关”
D.在犯错误的概率不超过0.1的前提下,认为“赞成‘自助游’与性别有关”
参考公式:
K2=,其中n=a+b+c+d.
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
答案 D
解析 将2×2列联表中的数据代入计算,得K2=≈3.030,∵2.706<3.030<3.841,∴在犯错误的概率不超过0.1的前提下,可以认为“赞成‘自助游’与性别有关”.
10.某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如下表:
x
6
8
10
12
y
2
3
5
6
则y对x的线性回归直线方程为( )
A.=2.3x-0.7B.=2.3x+0.7
C.=0.7x-2.3D.=0.7x+2.3
(相关公式:
=,=y-x)
答案 C
解析 ∵xiyi=6×2+8×3+10×5+12×6=158,x==9,y==4.
∴==0.7,=4-0.7×9=-2.3.
故线性回归直线方程为=0.7x-2.3.
11.在一次考试中,5名学生的数学和物理成绩如下表:
(已知学生的数学和物理成绩具有线性相关关系)
学生的编号i
1
2
3
4
5
数学成绩x
80
75
70
65
60
物理成绩y
70
66
68
64
62
现已知其线性回归方程为=0.36x+,则根据此线性回归方程估计数学得90分的同学的物理成绩为________(四舍五入到整数).
答案 73
解析 ==70,==66,
所以66=0.36×70+,解得=40.8.
所以0.36×90+40.8=73.2≈73.
12.某工厂为了对一种新研发的产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x(元)
4
5
6
7
8
9
销量y(件)
90
84
83
80
75
68
由表中数据,求得线性回归方程为=-4x+.若在这些样本点中任取一点,则它在回归直线左下方的概率为________.
答案
解析 由表中数据得x=6.5,y=80,由y=-4x+,得=106,故线性回归方程为=-4x+106.将(4,90),(5,84),(6,83),(7,80),(8,75),(9,68)分别代入回归方程,可知有6个基本事件,因84<-4×5+106=86,68<-4×9+106=70,故(5,84)和(9,68)在直线的左下方,满足条件的只有2个,故所求概率为=.
13.已知某学校的特长班有50名学生,其中有体育生20名,艺术生30名,在学校组织的一次体检中,该班所有学生进行了心率测试,心率全部介于50次/分到75次/分之间,现将数据分成五组,第一组[50,55),第二组[55,60),…,第五组[70,75],按上述分组方法得到的频率分布直方图如图所示.因为学习专业的原因,体育生常年进行系统的身体锻炼,艺术生则很少进行系统的身体锻炼,若前两组的学生中体育生有8名.
(1)根据频率分布直方图及题设数据完成下列2×2列联表.
心率小于60次/分
心率不小于60次/分
合计
体育生
20
艺术生
30
合计
50
(2)根据
(1)中表格数据计算可知,________(填“有”或“没有”99.5%的把握认为“心率小于60次/分与常年进行系统的身体锻炼有关”.
附:
K2=,其中n=a+b+c+d.
P(K2≥k0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
答案
(1)见解析
(2)有关
解析
(1)根据频率分布直方图可知,前两组的学生总数为(0.032+0.08)×5×50=10,又前两组的学生中体育生有8名,所以前两组的学生中艺术生有2名,故2×2列联表如下:
心率小于60次/分
心率不小于60次/分
合计
体育生
8
12
20
艺术生
2
28
30
合计
10
40
50
(2)由
(1)中数据知,K2=≈8.333>7.879,故有99.5%的把握认为“心率小于60次/分与常年进行系统的身体锻炼有关”.
14.(2018·山东日照一模)某学校高三年级有学生500人,其中男生300人,女生200人.为了研究学生的数学成绩是否与性别有关,现采用分层抽样的方法,从中抽取了100名学生,先统计了他们期中考试的数学分数,然后按性别分为男、女两组,再将两组学生的分数分成5组:
[100,110),[110,120),[120,130),[130,140),[140
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 课时 线性 回归 分析 统计 案例 整理