线性回归正态分布.docx
- 文档编号:27101183
- 上传时间:2023-06-27
- 格式:DOCX
- 页数:22
- 大小:128.31KB
线性回归正态分布.docx
《线性回归正态分布.docx》由会员分享,可在线阅读,更多相关《线性回归正态分布.docx(22页珍藏版)》请在冰豆网上搜索。
线性回归正态分布
一、选择题
1.
(2011陕西卷)设(X1,yi),(X2,y2),…,(Xn,yn)是变量X和y的
n个样本点,直线I是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()
A.x和y的相关系数为直线I的斜率
B.x和y的相关系数在0到1之间
C.当n为偶数时,分布在I两侧的样本点的个数一定相同
D.直线I过点(x,y)
2.甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性做试验,并用回归分析
方法分别求得相关系数r与残差平方和m如下表:
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
则哪位同学的试验结果体现A、B两变量有更强的线性相关性()
A.甲B.乙C.丙D.丁
3.下面是一个2X2列联表
y1
y2
总计
X1
a
21
73
X2
2
25
27
总计
b
46
则表中a、b处的值分别为()
A.94、96B.52、50C.52、54D.54、52
4.对分类变量X与Y的随机变量K2的观测值k,说法正确的是()
A.k越大,“X与Y有关系”可信程度越小
B.k越小,“X与Y有关系”可信程度越小
C.k越接近于0,“X与Y无关”程度越小
D.k越大,“X与Y无关”程度越大
5.(2011山东卷)某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万兀)
4
2
3
5
销售额y(万兀)
49
26
39
54
AAAA
根据上表可得回归方程'=门x+H中的r为9.4,据此模型预报广告费用为6万元时销
售额为()
A.63.6万元B.65.5万元C.67.7万元D.72.0万元
6•在第29届奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居世界金牌
榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见.有网友为
此进行了调查,在参加调查的2548名男性公民中有1560名持反对意见,2452名女性公民中有1200人持反对意见,在运用这些数据说明性别对判断“中国进入体育强国之列”是否有关系时,用什么方法最有说服力()
A.平均数与方差B.回归直线方程C.独立性检验D.概率
二、填空题
A
7.已知一个线性回归方程为’=1.5x+45(Xi€{1,7,5,13,19}),贝Vy=.
&第二十届世界石油大会将于2011年12月4日—8日在卡塔尔首都多哈举行,能源
问题已经成为全球关注的焦点.某工厂经过技术改造后,降低了能源消耗,经统计该厂某种产品的产量x(单位:
吨)与相应的生产能耗y(单位:
吨)有如下几组样本数据:
x
3
4
5
6
y
2.5
3
4
4.5
根据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得回归直线
的斜率为0.7.已知该产品的年产量为10吨,则该工厂每年大约消耗的汽油为吨.
9.x和y的散点图如图,则下列说法中所有正确命题的序号为.
3000
2500*
2000"
1500・
I000*・
500*,
心1234567S910^
1x,y是负相关关系;
2在该相关关系中,若用y=C1ec2x拟合时的相关指数为R2,用y=bx+a拟合时的相关
指数为r2,则r1>r2;
3X、y之间不能建立回归直线方程.
三、解答题
10.某电脑公司有6名产品推销员,其工作年限与年推销金额的数据如下表:
推销员编号
1
2
3
4
5
工作年限x/年
3
5
6
7
9
推销金额y/万元
2
3
3
4
5
(1)以工作年限为自变量x,推销金额为因变量y,作出散点图;
(2)求年推销金额y关于工作年限x的线性回归方程;
⑶若第6名推销员的工作年限为11年,试估计他的年推销金额.
11.
50
(2011广雅中学高三模拟)为了解某班学生喜爱打篮球是否与性别有关,对本班
人进行了问卷调查得到了如下的列联表:
喜爱打篮球
不喜爱打篮球
合计
男生
5
女生
10
合计
50
3
已知在全部50人中随机抽取1人抽到喜爱打篮球的学生的概率为3.
5
(1)请将上面的列联表补充完整;
⑵是否有99.5%的把握认为喜爱打篮球与性别有关?
说明你的理由.
12.2011年3月,日本发生了9.0级地震,地震引发了海啸及核泄漏•某国际组织用分层抽样的方法从心理专家、核专家、地质专家三类专家中抽取若干人组成研究团队赴日本工作,有关数据见表1(单位:
人).
核专家为了检测当地动物受核辐射后对身体健康的影响,随机选取了110只羊进行了检
测,并将有关数据整理为不完整的2X2列联表(表2).
表1
相关人员数
抽取人数
心理专家
24
x
核专家
48
y
地质专家
72
6
表2
高度辐射
轻微辐射
合计
身体健康
30
A
50
身体不健康
B
10
60
合计
C
D
E
附:
临界值表
Ko
2.072
2.706
3.841
5.024
6.635
7.879
10.828
P(K2>K0)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
参考公式:
K
2
2n(ad—be)
'—(a+b)(c+d)(a+e)(b+d)
(1)求研究小组的总人数;
⑵写出表2中A、B、C、D、E的值,并判断有多大的把握认为羊受到高度辐射与身体不健康有关.
每日作业正态分布
、选择题
1.(2012深圳调研)已知三个正态分布密度函数
2
4(x€R,i=1,2,3)的图象如图所示,贝U(
A.
B.—>—=—,3=<°<3
D.—V—=—,3=3V3
(-2=述,5=◎>⑦
C.-1=—V—,02=<3
2.已知X的分布列为
X
-1
0
1
P
1
1
1
2
3
6
,且Y=aX+3,EY=彳,贝Ua为()
3.正态总体N(1,9)在区间(2,3)和(-1,0)上取值的概率分别为m,n,则()
A.m>nB.m 4.已知随机变量E+n=8,若旷B(10,0.6),贝UE(n,D(R分别是() A.6和2.4B.2和2.4C.2和5.6D.6和5.6 5.口袋中有5只球,编号分别为1,2,3,4,5,从中任意取3只球,以X表示取出的球的 最大号码,则X的期望E(X)的值是() B.4.5C.4.75D.5 6.某种种子每粒发芽的概率都为0.9,现播种了1000粒,对于没有发芽的种子,每粒 需再补种2粒,补种的种子数记为X,则X的数学期望为() A.100B.200C.300D.400 二、填空题 7.若p为非负实数,随机变量X的概率分布如下表,则E(X)的最大值为,D(X) 的最大值为. X 0 1 2 P 1 2-p p 1 2 &拋掷两个骰子,至少有一个4点或5点出现时,就说这次试验成功,则在10次试验 中,成功次数X的期望是. 9.某班有50名学生,一次考试后数学成绩X(X€N)服从正态分布N(100,102),已知 P(90 一、选择题 1. (2011陕西卷)设(X1,yi),(X2,y2),…,(Xn,yn)是变量X和y的 n个样本点,直线I是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是() A.x和y的相关系数为直线I的斜率 B.x和y的相关系数在0到1之间 C.当n为偶数时,分布在I两侧的样本点的个数一定相同 D.直线I过点(x,y) 解析: 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越 接近1,两个变量的线性相关程度越强,所以A、B错误.C中n为偶数时,分布在I两侧 的样本点的个数可以不相同,所以C错误•根据回归直线方程一定经过样本中心点可知D 正确•所以选D. 答案: D 2.甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性做试验,并用回归分析 方法分别求得相关系数r与残差平方和m如下表: 甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m 106 115 124 103 则哪位同学的试验结果体现A、B两变量有更强的线性相关性() A.甲B.乙 C.丙D.丁 解析: 丁同学所得相关系数0.85最大,残差平方和m最小,所以A、B两变量线性 相关性更强. 答案: D 3.下面是一个2X2列联表 y1 y2 总计 X1 a 21 73 X2 2 25 27 总计 b 46 则表中a、b处的值分别为() C.52、54D.54、52 解析: •/a+21=73,「.a=52,又a+2=b, •'•b=54. 答案: C 4.对分类变量X与Y的随机变量K2的观测值k,说法正确的是() A.k越大,“X与Y有关系”可信程度越小 B.k越小,“X与Y有关系”可信程度越小 C.k越接近于0,“X与Y无关”程度越小 D. k越大,“X与Y无关”程度越大 解析: k越大,说明“X与Y有关系”成立的可信程度越大,反之越小. 答案: B C.67.7万元 D.72.0万元 4+2+3+5749+26+39+54 解析: •••x=4=2,y=4=42, AAA7AA 又'='x+八必过(x,y),「.42=9.4+订,二订=9.1. A •••线性回归方程为'=9.4x+9.1. A .•.当x=6时,’=9.4X6+9.1=65.5(万元). 答案: B 6.在第29届奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居世界金牌 榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见.有网友为 此进行了调查,在参加调查的2548名男性公民中有1560名持反对意见,2452名女性公民中有1200人持反对意见,在运用这些数据说明性别对判断“中国进入体育强国之列”是否有关系时,用什么方法最有说服力() B.回归直线方程 D.概率 A.平均数与方差 C.独立性检验 解析: 由于参加调查的公民性别分别被分成了两组,而且每一组被分成了两种情况,认为有关与无关符合2X2列联表的要求,故用独立性检验最有说服力. 答案: C 二、填空题 A 7•已知一个线性回归方程为’=1.5x+45(Xi€{1,7,5,13,19}),贝Vy=. A解析: 线性回归方程为’=1.5x+45,经过点(x,y),由x=9,知y=58.5. 答案: 58.5 &第二十届世界石油大会将于2011年12月4日—8日在卡塔尔首都多哈举行,能源 问题已经成为全球关注的焦点.某工厂经过技术改造后,降低了能源消耗,经统计该厂某种 产品的产量x(单位: 吨)与相应的生产能耗y(单位: 吨)有如下几组样本数据: x 3 4 5 6 y 2.5 3 4 4.5 根据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得回归直线 的斜率为0.7.已知该产品的年产量为10吨,则该工厂每年大约消耗的汽油为吨. 解析: 3+4+5+62.5+3+4+4.5 由题知,X—4=4.5,y=4=3.5,故样本数据的中心点 为A(4.5,3.5).设回归直线方程为y=0.7x+b,将中心点坐标代入得: 3.5=0.7X4.5+b, 解得b=0.35,故回归直线方程为y=0.7x+0.35,所以当x=10时,y=0.7X10+0.35=7.35, 即该工厂每年大约消耗的汽油为7.35吨. 答案: 7.35 9.x和y的散点图如图,则下列说法中所有正确命题的序号为 3000 2500* 2000・ 1500・ I000** 500*, 心12245678910^ 1x,y是负相关关系; 2在该相关关系中,若用y=5ec2x拟合时的相关指数为R? 用y=bx+a拟合时的相关 指数为r2,则r2>r2; 3x、y之间不能建立回归直线方程. 解析: ①显然正确;由散点图知,用y=C1ec2x拟合的效果比用y=bx+a拟合的效果 要好,.••②正确;x,y之间能建立回归直线方程,只不过预报精度不高,.••③不正确. 答案: ①② 三、解答题 10.某电脑公司有6名产品推销员,其工作年限与年推销金额的数据如下表: 推销员编号 1 2 3 4 5 工作年限x/年 3 5 6 7 9 推销金额y/万元 2 3 3 4 5 (1)以工作年限为自变量x,推销金额为因变量y,作出散点图; (2)求年推销金额y关于工作年限x的线性回归方程; ⑶若第6名推销员的工作年限为11年,试估计他的年推销金额. 解析: (1)依题意,画出散点图如图所示, ■x (2)从散点图可以看出,这些点大致在一条直线附近,设所求的线性回归方程为 A '=0.5x+04 (3)由⑵可知,当x=11时, A : =0.5x+0.4=0.5X11+0.4=5.9(万元). •可以估计第6名推销员的年推销金额为5.9万元. 11. 50 (2011广雅中学高三模拟)为了解某班学生喜爱打篮球是否与性别有关,对本班人进行了问卷调查得到了如下的列联表: 喜爱打篮球 不喜爱打篮球 合计 男生 5 女生 10 合计 50 3 已知在全部50人中随机抽取1人抽到喜爱打篮球的学生的概率为3. 5 (1)请将上面的列联表补充完整; (2)是否有99.5%的把握认为喜爱打篮球与性别有关? 说明你的理由. 解析: ⑴ 喜爱打篮球 不喜爱打篮球 合计 男生 20 5 25 女生 10 15 25 合计 30 20 50 250X(20X15-10X5) ⑵-K=30X20X25X25皿333>了.879. •••有99.5%的把握认为“喜爱打篮球与性别有关 12.2011年3月,日本发生了9.0级地震,地震引发了海啸及核泄漏•某国际组织用分层抽样的方法从心理专家、核专家、地质专家三类专家中抽取若干人组成研究团队赴日本工作,有关数据见表1(单位: 人). 随机选取了110只羊进行了检 核专家为了检测当地动物受核辐射后对身体健康的影响,测,并将有关数据整理为不完整的2X2列联表(表2). 表1 相关人员数 抽取人数 心理专家 24 x 核专家 48 y 地质专家 72 6 表2 高度辐射 轻微辐射 合计 身体健康 30 A 50 身体不健康 B 10 60 合计 C D E 附: 临界值表 Ko 2.072 2.706 3.841 5.024 6.635 7.879 10.828 2 P(K>K0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 参考公式: 2 k2n(ad—be) —(a+b)(c+d)(a+e)(b+d) (1)求研究小组的总人数; ⑵写出表2中A、B、C、D、E的值,并判断有多大的把握认为羊受到高度辐射与身体 不健康有关. 解析: 724824 (1)依题意知72=48=24, 解得y=4,x=2. 所以研究小组的总人数为2+4+6=12. (2)根据列联表特点得A=20,B=50,C=80,D=30,E=110. 110X(30X10-50X20) 50X60X80X30 由临界值表知,有99%的把握认为羊受到高度辐射与身体不健康有关. 每日作业正态分布 -V—=—,2=2v2 一、选择题 1.(2012深圳调研)已知三个正态分布密度函数 4(x€R,i=1,2,3)的图象如图所示,贝U( A.(-2=! -3,5=<2>⑦B- C.—=—V—,2v2=2D. 解析: 正态分布密度函数血(X)和如(X)的图象都是关于同一条直线对称,所以其平均 数相同,故—=—,又血(X)的对称轴的横坐标值比也(X)的对称轴的横坐标值大,故有-V— =又2越大,曲线越"矮胖”,2越小,曲线越"瘦高”,由图象可知,正态分布密度函数咖(X)和$2(x)的图象一样"瘦高”,艇(X)明显"矮胖”,从而可知2=2. 答案: D 2.已知X的分布列为 X —1 0 1 P 1 1 1 2 3 6 ,且Y=aX+3,EY=7,贝Ua为() 3 A.1B.2 C.3D.4 1111 解析: 先求出E(X)=(—1)X;+0X;+1X;=—;. 2363 再由y=aX+3得E(Y)=aE(X)+3. 答案: B 3.正态总体N(1,9)在区间(2,3)和(-1,0)上取值的概率分别为m,n,则() A.m>nB.m C.m=nD.不确定 解析: 正态总体N(1,9)的曲线关于x=1对称,区间(2,3)与(-1,0)与对称轴距离相等, 故m=n. 答案: C 4.已知随机变量Hn=8,若旷B(10,0.6),贝UE(n,D(R分别是() A.6和2.4B.2和2.4 C.2和5.6D.6和5.6 解析: 若两个随机变量nE满足一次关系式n=aE+b(a,b为常数),当已知E($、 2 D($时,则有E(n=aE($+b,D(n=aD($. 由已知随机变量外尸8,所以有尸8-$ 因此,求得E(n=8-E($=8-10X0.6=2, 2 D(n=(—1)D($=10X0.6X0.4=2.4. 答案: B 5.口袋中有5只球,编号分别为1,2,3,4,5,从中任意取3只球,以X表示取出的球的 最大号码,则X的期望E(X)的值是() A.4B.4.5 C.4.75D.5 解析: X的所有可能取值是3,4,5, 2 口11C33 且P(x=3)=C53=10,P(x=4)=C53=1? ••E(X)=3X10+4X秸+5X1=4.5. 答案: B 6.某种种子每粒发芽的概率都为0.9,现播种了1000粒,对于没有发芽的种子,每粒 需再补种2粒,补种的种子数记为X,则X的数学期望为() 解析: 种子发芽率为0.9,不发芽率为0.1,每粒种子发芽与否相互独立,故设没有发 芽的种子数为E,贝U匕B(1000,0.1), ••EE=1000X0.1=100, 故X的期望为2EE=200. 答案: B 、填空题 的最大值为 X 0 1 2 1 1 P 2—p p 2 ••E(X)=p+1<2,D(X)=—p2—p+1w1. 3 答案: 31 &拋掷两个骰子,至少有一个4点或5点出现时,就说这次试验成功,则在10次试验中,成功次数X的期望是. 解析: 225 由题意一次试验成功的概率为1—3x-=-,10次试验为10次独立重复试验, 则成功次数 X〜B10,9,所以E(X)=50 答案: 50 9 9.某班有50名学生,一次考试后数学成绩X(X€N)服从正态分布N(100,102),已知 P(90wX<100)=0.3,估计该班学生数学成绩在110分以上的人数为. 解析: 由题意知,P(X>110)=1—2P90WXW100=0.2, •该班学生数学成绩在110分以上的人数为0.2X50=10. 答案: 10 出师表 两汉: 诸葛亮 先帝创业未半而中道崩殂,今天下三分,益州疲弊,此诚危急存亡之秋也。 然侍卫之臣不懈于内,忠志之士忘身于外者,盖追先帝之殊遇,欲报之于陛下也。 诚宜开张圣听,以光先帝遗德,恢弘志士之气,不宜妄自菲薄,引喻失义,以塞忠谏之路也。 宫中府中,俱为一体;陟罚臧否,不宜异同。 若有作奸犯科及为忠善者,宜付有司论其刑赏,以昭陛下平明之理;不宜偏私,使内外异法也。 侍中、侍郎郭攸之、费祎、董允等,此皆良实,志虑忠纯,是以先帝简拔以遗陛下: 愚以为宫中之事,事无大小,悉以咨之,然后施行,必能裨补阙漏,有所广益。 将军向宠,性行淑均,晓畅军事,试用于昔日,先帝称之曰能”,是以众议举宠为督: 愚以为营中之事,悉以咨之,必能使行阵和睦,优劣得所。 亲贤臣,远小人,此先汉所以兴隆也;亲小人,远贤臣,此后汉所以倾颓也。 先帝在时,每与臣论此事,未尝不叹息痛恨于桓、灵也。 侍中、尚书、长史、参军,此悉贞良死节之臣,愿陛下亲之、信之,则汉室之隆,可计日而待也EI。 臣本布衣,躬耕于南阳,苟全性命于乱世,不求闻达于诸侯。 先帝不以臣卑鄙,猥自枉屈,三顾臣于草庐之中,咨臣以当世之事,由是感激,遂许先帝以驱驰。 后值倾覆,受任于败军之际,奉命于危难之间,尔来二十有一年矣。 先帝知臣谨慎,故临崩寄臣以大事也。 受命以来,夙夜忧叹,恐托付不效,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 回归 正态分布