大学统计学复习资料8相关doc.docx
- 文档编号:29006683
- 上传时间:2023-07-20
- 格式:DOCX
- 页数:32
- 大小:189.50KB
大学统计学复习资料8相关doc.docx
《大学统计学复习资料8相关doc.docx》由会员分享,可在线阅读,更多相关《大学统计学复习资料8相关doc.docx(32页珍藏版)》请在冰豆网上搜索。
大学统计学复习资料8相关doc
1.填空题
1.若全部观察值都落在直线上,则相关系数等于(±1)
2.按相关的方向分,相关关系可分为(正相关)和(负相关)。
3.相关系数为“-1”时,表示(完全负相关)相关。
4.相关系数是在(线性)相关条件下用來说明两个变量相关(关系)的统计分析指标。
5.估计标准误差是用来说明(回归方程)代表性大小的统计分析指标。
6.相关系数是在(线性)相关条件下,用来说明两个变量相关(强度)的统计分析。
7.现象之间的相关关系按相关的程度分有相关、相关和相关;
按相关的方向分有相关和相关;按相关的形式分有_相
关和相关;按影响因素的多少分有相关和相关。
完全相关、不完全相关、不相关;正相关、负相关;线性相关、非线性相关;单相关、复相关
8.完全相关即是相关,其相关系数为。
函数、土1
9.相关系数是在相关条件下用來说明两变相关的统计分析指标。
线性、密切程度
10.当变量X值增加,变量Y值也增加,这是相关关系;当变量X伉减少,变y:
Y
值也减少,这是相关关系。
正、正
11.在回归分析中,两变量不是对等的关系,其中因变量是变量,自变量是
()量。
随机、可控制的
13.用來说明回归方程代表性大小的统计分析指标是指标。
估计标准误;
14.当变UX按一定数额变动时,变量Y也按一定的数额变动,这时变UX与变量Y存在着关系。
直线相关
15.—个回归方程只能作一种推算,即给出的数值,估计的可能性。
自变量、因变量
16.已知X变量的标准差为2,因变量的标准差为5,两变量的相关系数为0.8,则冋归系数为
()2
17.已知直线冋归方程Yc=a+bx中,b=17.5;又知n=30L=13500,X=12,则可
知a=^240
2.简答题
1.说明相关系数的取值范围及其判断标准。
(1).相关系数的数值范围是在-1和+1之间,即-1 (2).判断标准: |R|<0.3为微弱相关,0。 3<|R|<0。 5为低度相关; 0.5<|R|<0o8这显著相关,0。 8<|R|<1为高度相关; |R|=0时,不相关,|R|=1时完全相关。 2.相关关系与函数关系有什么区别? 函数关系是现象之间的一种确定性的关系,相关关系是现象之间的一种不确定性的关系,函数关系一般表现为相关关系 3.什么是相关系数及其计算公式? 相关系数是在直线相关条件下,说明两个现象之间相关关系密切程度的统计分析指标。 4.相关关系的主要特征是什么? ①二现象之间存在一定的依存关系。 ②但它们不是确定的和严格依存的。 5.相关系数具有什么特点? (1)两个变量是对称的,不分自变量与因变量,因此,相关系数只有一个。 (2)相关系数有正负号之分,反映正相关与负相关。 3若以抽样调査取得资料,则两个变量都应是相同的随机变量。 6.简述佔计标准误差 的作用。 (1)说明回归估计值的准确程度,值愈小,说明估计值与实际值平均误差愈小,估计 的准确程度愈高,反之,估计的准确程度低。 (2)说明回归直线的代表性大小。 (3)说明x与y的相关密切程度。 (4)在抽样条件下,它是回归抽样误差的一个估计值。 7.相关关系的主要特征是什么? ①二现象之间存在一定的依存关系。 ②但它们不是确定的和严格依存的。 3.判断题 1.利用一个回归方程,两个变量可以互相推算。 X 2.计算相关系数的两个变量都是随机变量。 V 3.根据结果标志对因素标志的不同反映,付以把现象总体数量上的依存关系分为蚋数关系和相关关系。 ()V 4.正相关指的就是因素标志和结果标志的数fi变动方向都是上升的。 ()X 5.相关系数是测定变量之间相关密切程度的唯一方法。 ()X 6.只有当相关系数接近于+1时,才能说明两变量之间存在的高度相关关系。 若变量X的值减少时变量Y的值也减少,说明变量X与Y之间存在正的相关关系。 ()X 7.若变: W: X的值减少时变量Y的值也减少,说明变量X与Y之间存在正的相关关系。 ()X 8.冋归系数和相关系数都可以用来判断现象之间相关的密切程度。 ()V 9.若直线回归方程Yc=170-2.5x,则变量度和之间存在负的相关关系。 X 10.按直线回归方程Yc=a+bx配合的直线,是一休具有平均意义的直线。 ()V 11.回归分析中,对于没有明显关系的两个变量,可以建立倚变动和倚变动的两个回归方程。 ()V 12.由变量Y变量X冋归和由变量X倚变量Y回归所得到的回归方程之所以不同,主要是因为方程中参数表示的意义不同。 ()V 13.估计标准误指的就是实际值y与估计值yc的平均误差程度。 ()V 14.在任何相关条件下,都可以用相关系数说明变量之间相关的密切程度。 ()X 15.研究发现,花在看电视上的小时数与阅读测验得分之间是负相关,因而可以认为看电视是使阅读能力降低的原因。 X 16.根据航班正点率(%)与旅客投诉率(次/万名)建立的回归方程为: >? =6.02-0.07-^, 某屮回归系数为一0.07,表示旅客投诉率与航班正点率之间是低度相关。 V 4.单项选择题 1.产品产量与单位成本之间的简单相关系数为-0.92,并通过检验,这说明二者之间存在着(A)。 A、高度相关B、中度相关C、低度相关D、极弱相关 2.当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于() A相关关系B函数关系C回归关系D随机关系 B 3.现象之间的相互关系可以归纳为两种类型,即() A相关关系和函数关系B相关关系和因果关系C相又又系和随机义系D函数关系和因果关系 A 4.相关系数的取值范围是() A、O^R^l B、-1 C、-l^R^l D、-l^R^OA 5.变量之间的相关程度越低,则相关系数的数值() A越小B越接近于0C越接近于-1D越接近于1 B 6.在价格不变的条件下,商品销售额和销售量之间存在着() A不完全的依存关系B不完全的随机关系C完全的随机关系D完全的依存关系 B 7.下例哪两个变簠之间的相关程度高() A商品的销售额与商品销售量的相关系数是0.9; B商品销雋额与商业利润率的相关系数是0.84; C平均流通费川率与商业利润率的相关系数是-0.94; D商品销售价格与销售量的相关系数是-0.91 D 8.M归分析中的两个变呈() A都是随机变量 B关系是对等的 C都是给定的量 D一个是自变量,一个是因变量 9.每一吨铸铁成本(元)倚铸件废品率(%)变动的冋归方程为: Yc=56+8X 这意味着() A废品率每增加1%,成本每吨增加64元B废品率每增加1%,成本每吨增加8% C废品率每增加1%,成本每吨增加8元D如果废品率增加1%,则每吨成本为56元C 10.某校对学生的考试成绩和学习时间的关系进行测定,建立了考试成绩倚学习时间的直线回归方程为: Yc=180-5X,该方程明显有错,错误在于() A、a值的计算有误,b值是对的 B、b值的计算有误,a值是对的 C、a值和b值的计算都有误 D、自变和因变量的关系搞错了C 11.配合回归方程对资料的要求是() A因变量是给定的数值,自变量是随机的B自变量是给定的数伉,因变量是随机的C自变量和因变量都是随机的D自变量和因变量都是不随机的 12.佔计标准误说明回归直线的代表性,因此() A估计标准误数伉越大,说明回归直线的代表性越小B估计标准误数值越大,说明冋归直线的代表性越小C估计标准误数值越小,说明回归直线的代表性越小D估计标准误数值越小,说明回归直线的实用价值小B 13.相关系数的值总是() A.>0 B.彡1 C.在0和1之间 D.在-1和1之间 E.等于1 14.对于一给定的数据集合, 发现变量X和Y之间的相关系数r=-0.9。 这说明 B.X随Y的减少而增加 D.这个计算是错误的 A.在X和Y之间不存在线性关系 C.在X和Y之间存在因果关系 E.X随Y的减少而减少 15.研宂发现工人的性别与收入之间的相关系数r=-0.61,那么() A.平均来看女性收入高于男性 B.平均来看女性收入低于男性 C.计算错误,这个r值不可能存在 D.这是没有意义的,因为r在这里无意义 E.这里相关系数-0.61没有太大意义,因为性别和收入之间的相关系数可能是非线性的 16.如果体重和收入之间的相关系数很高并且是正的,那么说明() A.高收入使人们吃更多的贪物 B.低收入使人们吃更少的贪物 C.一般來看,高收入人群花费在食物上的收入比例大于低收入人群 D.—般来看,高收入人群比低收入人群重 E.高收入使人的体重增加 17.—数据集合的散点图如下: 观察到的图形是() 八.非线性的并且含有几个异常值 B.非线性的并且至少含有一个有影响的观测值 C.近似线性并且有正的斜率 D.近似线性但有几个异常值 E.近似线性并且有负的斜率 >- 0.70.60.50.40.30.20.1 0 ♦♦令 ♦♦ 20 40 60 80100120140 第5题 18.20世纪50年代美国失业率的散点图如下,下列陈述中正确的是: () A.在此期间失业率是常数 B.在此期间失业率随时间减少 C.失业率和时间之间存在适度正相关 D.A和C都正确 E.B和C都正确 4 3 2 1 0 19. 仑分念分务各仑分勞、20世纪50年代? 当水流过农田时,一些土壤会随之流走,从而导致侵蚀。 做实验研宄水流速度对土壤流失量的影响,水流用升/秒度量,而被侵蚀的土壤用千克来度量。 数据如下表: 水流速 0.31 0.85 1.26 2.47 3.75 被侵蚀的土壤 0.82 1.95 2.18 3.01 6.07 在流速和被侵蚀的土壤a之间的关系是: () A.正的 C.即不是正的也不是负的 20.相关系数度量() A.两个变: W: 之间是否存在关系C.两个变: 之间是否存在因果关系 21. B.负的 D.无法确定 B.散点阁是否显示有意义的模型 D.两个变量之间直线关系的强度 欲确定身高(厘米)和体重(千克)之间的相关系数,对两个21岁的男性的测量结果如下: 身高178191 体重6075 二者之间的相关系数是() A.1.0B.正的且在0.25和0.75之间 C.近似于0,但可能是正的也可能是负的D.0 22.—位同学想知道约会的男女之间身高是否相似。 她测量了自己,她的室友和相邻房间的女性的身高;然后又测量了毎位女性下一位约会男性的身高。 数据如下: 女168163168165178165 男183173178173188175 下列陈述屮正确的是() A.测量的变量是类别型的 B.男女之间的身高存在强正相关,因为女性总是比她们所约会的男性矮 C.男女之间的身髙存在正相关 D.相关系数在这里没有意义,因为性别是类别型的 23.下列陈述中正确的是() A.相关系数等于两个变量落在同一条直线上的次数的比例 B.只有当所有数据都在一条完企水平的直线上时,相关系数才是+1.0 C.相关系数测量出现在散点图上的异常点的部分 D.相关系数是一个无单位的数,并且总是在[-1.0,+1.0]内 24.下列陈述中正确的是() A.改变x或y的度量单位,不会改变相关系数的值 B.负的相关系数说明数据是强无关的 C.相关系数总是和x变量有相同的单位,而不是和y变量一样 D.相关系数总是和y变量有相同的单位,而不是和x变量一样 25.关于丁面的变量X和Y散点图的结论正确的是() A.因为二者之间儿乎是完全相关的,所以X和Y之间的相关系数必接近于1 B.因为二者之间儿乎是完全相关的,所以X和Y之间的相关系数必接近于-1 C.X和Y之间的相关系数接近于0 D.X和Y之间的相关可能在-1和+1之间的任何数伉。 在不知道实际伉的情况下我们无法做出具体判断 26.下而关于相关系数r的陈述正确的是() A.它是相关的强测度 B.-1«1 C.如果r是X和Y之间的相关系数,那么-r是Y和X之间的相关系数 D.以上都正确 27.下而哪一个数裾集合屮X和Y的相关系数r等于1? () A.X: -101B.X: 123C.X: 123D.X: -202 Y: 345 Y: -1-2-3 Y: 1-21 Y: 606 28.对某班级的调查发现学社身高和他所带的硬币数之间的相关系数为r=-0.30,据此可 出结论() A.矮个子的人倾向于花更多的钱 B.这是错的,因为-0.30的相关系数没有意义 C.带着硬币抑制身高 D.这是错的,因为身高和硬币之间的相关系数无法计算 E.高个子的人倾向于有更少的钱。 29.相关系数给出了() A.一个变量变化导致的另一个变量变化的测量。 B.两个类别型变量之间的线性联系强度的测量。 C.两个类别型变量之间的联系强度的测量。 D.两个定量变量之间的线性联系强度的测量。 E.—个定量变量和一个类别型变量之间线性联系强度的测量。 30.两个奥运会的运动员在每个运动项H上打平,比分总是相同的。 但不同项目的实际分数 不同。 这两个运动员的分数之间的相关系数是() A.1.0B.0.0C.-1.0D.无法确定E.0.5 31.相关系数是两个定量变量之间的线性关系的强度和方向的一个测度。 由变量x和y所表示的一组数据点之间的相关系数r=0.95,这说明() A.x值越大,对应的y值越小。 B.在x和y之间存在强线性关系,x值越大,对应的y值越大。 C.不能证明x和y之间有线性关系。 D.x和y之间存在强线性关系,x值越大,对应的y值越小。 E.所有数据点都在同一条直线上。 32.如果两个变量的联系方式是非线性的,相关系数: () A.总是负的B.可以计算,但不能解释关系的本质 C.在-1和+1之间D.总是正的E.无法计算 33.根据观测数据发现房子的出售价格和房子屮卧室的数量之间是正相关的。 所以有() A.较多的卧室使得房子的价格更贵 B.高价格使得房子屮有吏多的卧室 C.有三间卧室的房子总是比有两间卧室的房子贵 D.房子的售价越高,房子中卧室的数量越多 R.房子的售价越高,房子中卧室的数量越少 34.为了研究高血压和心血管疾病之间的联系,对一组年龄在35到64岁之间的男性进行了为期5年的跟踪调查,得出下表中的数据: 血压 死亡 总数 低 10 2000 高 50 3500 根据这些数据,下列陈述中正确的是() A.这些数据表明血压和由心血管疾病造成的死亡之间有联系 B.高血压男性的死亡率是低血压男性的死亡率的5倍 C.这些数据可能低估了高血压和由心血管疾病造成的死亡之间联系,因为男性倾向于低报他们的真实血压 D.以上都对 35.已知变量x和y之间的相关系数为0.83,那么新的变量x*=x/10和y*=5y之间的相关系数为() 36.若回归直线方程中的回归系数0时,则相关系数( -1 38.当? '=0.8时,下列说法正确的是( 180%的点都密集在一条直线的周围②80%的点高度相关 ③其线性程度是7=0.4的两倍 ④两变量高度正线性相关 39.在直线回归方程>=回归系数6表示() 1当*=0时7的平均值②*变动一个单位时>的变动总量 3y变动一个单位时X的平均变动量④X变动一个单位时的平均变动量 40.冋归估计标准差&的值越小,判定系数的值越大,则回归直线() ①拟合程度越低 ②拟合程度越高 ③拟合程度有可能高有可能低 ④用回归方程进行预测越不准确 41.如果相关系数为负,说明( ) ’一般小于夂 ②义一般小于} 3随着一个变量增加,另一个变量减少④随着一个变量减少,另一个变量也减少 42.已知I与之间存在负相关关系,指出下列哪一个回归方程肯定是错误的( 1夕=—20—0.82又②夕=300—1.82义③夕=—150+0.75又④$=87—0.32又 43.若协方差2以—幻什―刃大于0,则两变量之间的相关关系是() 1正相关②负相关③高度相关④低度相关 44.由同一资料计算的相关系数%与回归系数&之间的关系是() 17大6也大②7小6也小③7与&同值④/与々同符号 45.居民收入与储蓄额之间的相关系数可能是() 1一0.9247②0.9247 46.下列关系中属于负相关的有( ①总成本与原材料消粍: W: ③居民收入与消费支出 ③一1.5362④1.5362 ) 2合理范围内的施肥从与农产: 4产量与单位产品成本 47.某研究人员发现,举重运动员的体重与他能举起的重M之间的相关系数为0.6,则() 1体重越重,运动员平均能举起的重量越多 2平均来说,运动员能举起其体重60%的重y: 3如果运动员体重增加10公斤,则可多举6公斤的重 4举重能力的60%归因于其体重 48.具有因果关系的现象() ①必然具有函数关系②必然具有相关关系 3必然具有线性相关关系④必然具有非线性相关关系 49.对具奋因果关系的现象进行回归分析时() ①只能将原因作为自变量②只能将结果作为自变S ③二者均可作为自变y: ④没有必要区分自变g 50.对于有线性相关关系的两变量建立的直线回归方程&=中,回归系数&() ①可以小于0②只能是正数③可以为0④只能是负数 51.大样本条件下,回归估计置信区间的上下限() 1是对称地落在回归直线两侧的两条喇叭型曲线 2是对称地落在回归直线两侧的两条直线 3是区间越来越宽的两条直线④是区间越來越宽的两条曲线 五.多项选择题 1.测定现象之间有无相关关系的方法是() A编制相关表B绘制相关图C对客观现象做定性分析D计算估计标准误E配合回归方程 ABC 2.直线冋归分析中() A自变量是可控制量,因变量是随机的B两个变量不是对等的关系C利用一个回归方程,两个变fi可以互相推算D根据回归系数可岁定相关的方向R对于没有系数可判定的两变量可求得两个回归方程 ABDE 3.下例属于相关现象的是() A家庭收入越多,其消费支出也越多; B某产品产量随工人劳动生产率的提高而增加; C流通费用率随商品销售额的增加而减少; D生产单位产品所耗工时随劳动生产率的提高而减少E产品产量随生产用固定资产价值的减少而减少。 ABE 4.直线回归方程Yc=a+bx中的称为回归函数,回归系数的作用是() A可确定两变量之间因果的数量关系B可确定两变量的相关方向C可确定两变量的实际伉与估计伉的变异程度D可确定因变量的实际值与估计值的变异程度E可确定当自变量增加一个单位吋,因变量的平均增加值 ABE 5.计算相关系数时() A相关的两个变量都是随机的B相关的两个变fi是对等的 C相关的两个变量一个是随机的,一个是可控制的量D相关系数有正负号,可判断相关的方向E可以计算出自变量和因变量两个相关系数 ABD 6.可用来判断现象之间相关方向的指标有() A估计标准误B相关系数C回归系数D两个变量的协方差E两个变量的标准差 ABD 7.工人的工资(元)依劳动生产率(千元)的回归方程为Yc10+70x,这意味着() A如果劳动生产率等1000元,则工人工资为70元; B如果劳动生产率每增加1000元,则工人的工资平均提高70元; C如果劳动生产率等于1000元,则工人工资增加80元; D如果劳动生产率等1000元,则工人工资为80元; R如果劳动生产率每下降1000元,则工人工资平均减少70元。 BCD 8.在lnl归分析中,就两个相关变量x与y而言,变量y倚变量x的M归和变量x倚变量y的M归所得的两个回归方程是不同的,这种不同表现在() A方程中参数估计的方法不同B方程中参数的数值不同C参数表示的实际意义不同D估计标准误的计算方法不同E估计标准误的数值不同 BDE 9.估计标准误是反映() A回归伉与实际伉平均误差程度的指标B估计值与实际值平均误差程度的指标C自变量与因变量离差程度的指标D因变量估计值的可靠程度的指标E回归方程实用价值大小的指标 BCE 10.一个由100人组成的25-64岁男子的样本,测得其身高与体重的相关系数7为0.4671, ①单相关②复相关③高度相关④正相关⑤S著相关 13.如果两个变量之间完企相关,则以下结论中正确的是() ①相关系数的绝对值等于1②判定系数^2等于1 ③回归系数&大于0 ④回归估计标准差~等于1 5回归估计标准差~等于0 14.根据某样本资料得产fi(万件)与单位产品成本(百元)之间的回归方程为920 -8^,这意味着() ①产量与单位成本之间是负相关②产量与单位成本之间是正相关 3产量为1万件时,单位成本平均为912百元 4产量每增加1万件,单位成本平均增加8百元 5产量每增加1万件,单位成本平均减少8百元 15.指出下列表述哪些肯定是错误的() 八八 ①;V=8O+5X7=0.6128②);=—30+5义7=0.8746 380—5X0.6521④)’=—30+5义入=—0.8746 八 5-100-2又^=-1.2011 16.机床的使川年限与维修费川之间的相关系数是0.7213,合理范围内施肥量与粮食亩产量之间的相关系数为0.8521,商品价格与需求量之间的相关系数为一0.9345;则() 1商品价格与耑求量之间的线性相关性最低 2商品价格与需求量之间的线性相关性最高 3施肥量与粮食亩产量之间的线性相关性最高 4施肥量与粮食亩产量之间的线性相关性最低 5机床的使用年限与维修费用之间的线性相关性最低 17. ) ②实际值与其平均值的离差平方和最小 ④实际值与其估计值的离差平方和最小 ) ②单位产品成本与劳动生产率④存款利率与存款期限 理想的冋归直线,应满足( ①实际值与其平均值的离差和为0 ③实际值与其估计值的离差和为0⑤平均值与其估计值的离差平方和最小 18.下列现象具有相关关系的有( ①降雨量与农作物产量③人口自然增长率与农业贷款 5利息收入与存款利率 19.在直线回归方程屮,回归系数的数值(②⑤) ①表明两变量之间的相关程度②表明两变量之间的变动比例 ③表明两变量之间的密切程度④表明两变量之间的计算单位 5在数学上称为斜率 六.计算题 1.某
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学 统计学 复习资料 相关 doc
![提示](https://static.bdocx.com/images/bang_tan.gif)