回归分析试题.docx
- 文档编号:23991457
- 上传时间:2023-05-23
- 格式:DOCX
- 页数:14
- 大小:59.34KB
回归分析试题.docx
《回归分析试题.docx》由会员分享,可在线阅读,更多相关《回归分析试题.docx(14页珍藏版)》请在冰豆网上搜索。
回归分析试题
1.(2011•陕西)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )
A.x和y的相关系数为直线l的斜率
B.x和y的相关系数在0到1之间
C.当n为偶数时,分布在l两侧的样本点的个数一定相同
D.直线l过点(x,y)
2.(2011•山东)某产品的广告费用x与销售额y的统计数据如下表
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程
̂
y
=
̂
b
x+
̂
a
中的
̂
b
为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元
B.65.5万元
C.67.7万元
D.72.0万元
3.(2011•江西)为了解儿子身高与其父亲身高的关系,随机抽取5对父子身高数据如下
父亲身高x(cm)
174
176
176
176
178
儿子身高y(cm)
175
175
176
177
177
则y对x的线性回归方程为( )
A.y=x-1
B.y=x+1
C.y=88+
1
2
x
D.y=176
4.(2011•辽宁)调查了某地若干户家庭的年收x(单位:
万元)和年饮食支出y(单位:
万元),调查显示年收入x与年饮食支出y具有线性相关关系,井由调查数据得到y对x的回归直线方程
̂
y
=0.254x+0.321.由回归直线方程可知,家庭年收入每增加 1万元,年饮食支出平均增加
万元.
5.(2011•广东)工人月工资y(元)与劳动生产率x(千元)变化的回归方程为
̂
y
=50+80x,下列判断正确的是
①劳动生产率为1千元时,工资为130元;②劳动生产率提高1千元,则工资提高80元;③劳动生产率提高1千元,则工资提高130元;④当月工资为210元时,劳动生产率为2千元.
1.下列关于残差的叙述正确的是( )
A.残差就是随机误差B.残差就是方差
C.残差都是正数D.残差可用来判断模型拟合的效果
解析:
选D.由残差的相关知识可知.
2.(2010年高考湖南卷)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A.=-10x+200 B.=10x+200C.=-10x-200D.=10x-200
解析:
选A.由于销售量y与销售价格x成负相关,故排除B、D.又当x=10时,A中y=100,而C中y=-300,C不符合题意,故选A.
3.如图四个散点图中,适合用线性回归模型拟合其中两个变量的是( )
A.B.
C.D.
解析:
选B.图是正相关线性最强,图是负相关线性最强,散点图的点较分散.
4.(2011年高考辽宁卷)调查了某地若干户家庭的年收入x(单位:
万元)和年饮食支出y(单位:
万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:
y=0.354x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:
由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254.
答案:
0.254
一、选择题
1.下列各关系中是相关关系的是( )路程与时间、速度的关系;
加速度与力的关系;
产品成本与产量的关系;
圆周长与圆面积的关系;
广告费支出与销售额的关系.
A.B.
C.D.
解析:
选C.都是确定的函数关系.
2.能表示n个点与相应直线在整体上的接近程度的是( )
A.(yi-i)B.(i-yi)
C.(yi-i)2D.(yi-)2
解析:
选C.残差平方和表示接近程度.
3.对两个变量y和x进行回归分析,得到一组样本数据:
(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是( )
A.由样本数据得到的回归方程=x+必过样本点的中心(,)
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好
D.若变量y和x之间的相关系数r=-0.9362,则变量y和x之间具有线性相关关系
解析:
选C.R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C.
4.某医学科研所对人体脂肪含量与年龄这两个变量研究得到一组随机样本数据,运用Excel软件计算得=0.577x-0.448(x为人的年龄,y(单位:
%)为人体脂肪含量).对年龄为37岁的人来说,下面说法正确的是( )
A.年龄为37岁的人体内脂肪含量都为20.90%
B.年龄为37岁的人体内脂肪含量为21.01%
C.年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%
D.年龄为37岁的大部分的人体内脂肪含量为31.50%
解析:
选C.当x=37时,=0.577×37-0.448=20.901≈20.90,由此估计:
年龄为37岁的人群中的大部分人的体内脂肪含量为20.90%.
5.在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x间的线性回归方程为( )
A.=x+1B.=x+2
C.=2x+1D.=x-1
解析:
选A.由题意可知变量y与x成线性相关关系,且斜率=1,代入点(1,2),即可得出线性回归方程=x+1.
6.有下列数据
x123y35.9912.01
下列四个函数中,模拟效果最好的为( )
A.y=3×2x-1B.y=log2x
C.y=3xD.y=x2
解析:
选A.当x=1,2,3,代入求y值,求最接近y的值.
二、填空题
7.对具有线性相关关系的变量x和y,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.
解析:
由题意知=2,=3,=6.5,所以=-=3-6.5×2=-10,即回归直线的方程为=-10+6.5x.
答案:
=-10+6.5x
8.如图是x和y的一组样本数据的散点图,去掉一组数据________后,剩下的4组数据的相关指数最大.
解析:
经计算,去掉D(3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大.
答案:
D(3,10)
9.为了考察两个变量y与x的线性相关性,测得x,y的13对数据,若y与x具有线性相关关系,则相关指数R2的取值范围是________.
解析:
相关指数R2=1-.R2的取值范围是[0,1].当R2=0时,即残差平方和等于总偏差平方和,解释变量效应为0,x与y没有任何关系;当R2=1时,即残差平方和为0,x与y之间是确定的函数关系;其他情形,即当x与y是不确定的相关关系时,R2(0,1).
答案:
(0,1)
三、解答题
10.对两个变量x,y取得4组数据(1,1),(2,1.2),(3,1.3),(4,1.37),甲、乙、丙三人分别求得数学模型如下:
甲y=0.1x+1,乙y=-0.05x2+0.35x+0.7,丙y=-0.8·0.5x+1.4,试判断三人谁的数学模型更接近于客观实际.
解:
对甲模型:
残差平方和(yi-i)2=0.0109;
对乙模型:
残差平方和(yi-i)2=0.0049;
对丙模型:
残差平方和(yi-i)2=0.0004.
显然丙的残差平方和最小,故丙模型更接近于客观实际.
11.关于x与y有如下数据:
x24568y3040605070有如下的两个线性模型:
=6.5x+17.5;
=7x+17.
试比较哪一个拟合效果更好.
解:
由可得yi-i与yi-的关系如下表:
yi-i-0.5-3.510-6.50.5yi--20-1010020所以(yi-i)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155,
(yi-)2=(-20)2+(-10)2+102+02+202=1000.
所以R=1-=1-=0.845.
由可得yi-i与yi-的关系如下表:
yi-i-1-58-9-3yi--20-1010020所以(yi-i)2=(-1)2+(-5)2+82+(-9)2+(-3)2=180,
(yi-)2=(-20)2+(-10)2+102+02+202=1000.
所以R=1-=1-
=0.82.
由于R=0.845,R=0.82,0.845>0.82,
所以R>R.
故的拟合效果好于的拟合效果.
12.为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下
时间x/天123456繁殖个数y612254995190
(1)用时间作解释变量,繁殖个数作预报变量作出这些数据的散点图;
(2)求y与x之间的回归方程;
(3)计算残差,相关指数R2,并描述解释变量与预报变量之间的关系.
解:
(1)散点图如图所示:
(2)由散点图看出样本点分布在一条指数函数y=c1ec2x的周围,于是令z=lny,则
x123456z1.792.483.223.894.555.25由计数器算得,相关系数r≈0.9999>0.75,所以z与x有很强的线性相关关系.因此得=0.69x+1.112,则有=e0.69x+1.112.
(3)
6.0612.0924.0948.0495.77190.9y612254995190=(yi-i)2=3.1643,
(yi-)2=-62≈24642.83,
R2=1-≈0.9999.
即解释变量时间对预报变量繁殖细菌的个数解释了99.99%.
1.下列较合适用两变量相关关系的是( )
A.圆的面积与半径
B.人的身高与体重
C.色盲与性别
D.身高与学习成绩
2.在中,代表了数据点和它在直线上相应位置的差异的是( )
A.总偏差平方和
B.残差平方和
C.回归平方和
D.相关指数
4.中,相关指数R2的值越大,说明残差平方和( )
A.越小
B.越大
C.可能大也可能小
D.以上都不对
5.对两个具有线性相关关系的变量进行时,得到一个方程为
y
=1.5x+45,x∈{1,5,7,13,14},则
.
y
=
.
6.在对两个变量x,y进行线性时有以下步骤:
(1)利用方程进行预测;
(2)收集数据(xi,yi),i=1,2,…,n;
(3)求线性方程;(4)根据所收集的数据绘制散件图.
则正确的操作顺序是.
8.对两个变量Y与X进行,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是( )
A.模型Ⅰ的相关系数r为0.96
B.模型Ⅱ的相关系数r为0.81
C.模型Ⅲ的相关系数r为0.53
D.模型Ⅳ的相关系数r为0.35
9.下列结论正确的是( )
①函数关系是一种确定性关系;
②相关关系是一种非确定性关系;
③是对具有函数关系的两个变量进行统计的一种方法;
④是对具有相关关系的两个变量进行统计的一种常用方法.
A.①②
B.①②③
C.①②④
D.①②③④
10.给出以下四个命题:
①在直线方程
y
=0.2x+12中,当解释变量x每增加一个单位时,预报变量
y
平均减少0.2个单位;
②在中,残差平方和越小,拟合效果越好;
③在中,直线过样本点中心;
④对分类变量X与Y,它们的随机变量K2(χ2)的观测值k来说,k越小,“X与Y有关系”的把握程度越大.
其中正确命题的序号为
.(把你认为正确的命题序号都填上)
11.给出命题:
①线性就是由样本点去寻找一条贴近这些点的直线;
②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;
③通过方程
̂
y
=bx+a及其系数b可以估计和预测变量的取值和变化趋势;
④线性相关关系就是两个变量间的函数关系.其中正确的命题是( )
A.①②
B.①④
C.①②③
D.①②③④
12.在对两个变量x,y进行线性时,有下列步骤:
①对所求出的直线方程作出解释;
②收集数据(xi,yi),i=1,2,…,n;
③求线性方程;④求相关系数;
⑤根据所搜集的数据绘制散点图.
如果根据可形性要求能够作出变量x,y具有线性相关结论,则在下列操作顺序中正确的是( )
A.①②⑤③④
B.③②④⑤①
C.②④③①⑤
D.②⑤④③①
13.在的问题中,我们可以通过对数变换把非线性方程y=c1ec2x(c1>0)转化为线性方程,即两边取对数,令z=lny,得到z=c2x+lnc1.受其启发,可求得函数y=xlog2(4x)(x>0)的值域是
.
14.已知x,y的取值如下表:
x
0
1
3
4
y
2.2
4.3
4.8
6.7
从散点图,y与x线性相关,则方程为
.
y
=bx+a必过点
.
15.已知x,y的取值如表:
x
1
2
3
4
y
2.2
3.8
5.5
6.5
从散点图,y与x线性相关,且方程为
̂
y
=1.86x+a,则a=( )
A.-0.15
B.-0.26
C.-0.35
D.-0.61
16.某中学期中考试后,对成绩进行,从某班中选出5名学生的总成绩和外语成绩如下表:
则外语成绩对总成绩的直线方程是
.
20.对两个变量y与x进行线性,分别选择了4个不同的模型,它们的相关系数r如下,其中拟合程度最好的模型是( )
A.模型1的相关系数r为0.98
B.模型2的相关系数r为0.80
C.模型3的相关系数r为0.50
D.模型4的相关系数r为0.25
22.对两个变量y和x进行,得到一组样本数据:
(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是
( )
A.由样本数据得到的回归方程
̂
y
=
̂
b
x+
̂
a
必过样本中心点(
.
x
,
.
y
)
B.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
C.残差平方和越小的模型,拟合的效果越好
D.在线性回归模型中,R2=0.92表示解释变量解释了92%的预报变量
27.(2011•广东)某数学老师身高176cm,他爷爷、父亲和儿子的身高分别是173cm、170cm和182cm.因儿子的身高与父亲的身高有关,该老师用线性的方法预测他孙子的身高为
cm.
30.变量U与V相对应的一组样本数据为(1,1.4),(2,2.2),(3,3),(4,3.8),由上述样本数据得到U与V的线性,R2表示解释变量对于预报变量变化的贡献率,则R2=( )
A.
3
5
B.
4
5
C.1
D.3
31.甲、乙、丙、丁四位同学各自对A、B 两变量的线性关系做实验,并用方法分别求得相关指数R2与残差平方和M,如表,则测试结果体现A,B两变量的线性关系最强的是( )
甲
乙
丙
丁
R2
0.82
0.78
0.69
0.85
M
106
115
124
103
A.甲
B.乙
C.丙
D.丁
32.给出下列结论:
(1)是对具有相关关系的两个变量进行统计的一种常用方法;
(2)在中,可用指数系数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好;(其中R2=1-
n
i=1
(yi-
yi
)2
n
i=1
(yi-
.
y
)2
)
(3)在中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;
(4)在中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.
以上结论中,正确的有( )个.
A.1
B.2
C.3
D.4
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 试题