9062《统计学基本知识》.docx
- 文档编号:29835477
- 上传时间:2023-07-27
- 格式:DOCX
- 页数:21
- 大小:37.29KB
9062《统计学基本知识》.docx
《9062《统计学基本知识》.docx》由会员分享,可在线阅读,更多相关《9062《统计学基本知识》.docx(21页珍藏版)》请在冰豆网上搜索。
9062《统计学基本知识》
37、
为什么要对回归模型进行检验?
参考答案:
我们建立回归模型的目的是为了应用它来研究经济问题,但如果马上就用这个模型去预测,控制,分析,显然是不够慎重的,所以我们必须通过检验才能确定这个模型是否真正揭示了被解释变量和解释变量之间的关系。
38、简述相关分析和回归分析的关系
参考答案:
相关分析不必区分自变量(解释变量)和因变量(被解释变量),变量之间是平行关系,而回归分析要根据研究目的确定自变量和因变量,变量之间是因果关系;
相关分析中两个变量都是随机的,而回归分析中,因变量是随机变量,而自变量是非随机的;
回归分析可以得到变量之间关系的方向、强弱程度和具体数量变动关系,而相关分析只能确定变量之间关系的方向和程度;
回归分析实在相关分析的基础之上,进一步研究现象之间的数量变化规律。
39、回归模型中随机误差项ε的意义是什么?
参考答案:
ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。
40、简述抽样估计的优良标准?
参考答案:
1)无偏性:
指样本指标的平均数等于被估计的总体指标。
(2)有效性:
用样本指标估计总体指标时,若某样本指标的方差比其他估计量的方差小,则称该样本指标是总体指标的最有效的估计量。
(3)一致性:
以样本指标估计总体指标,要求当样本单位数相当大时,样本指标充分靠近总体指标,则称这个估计量为一致的估计量。
41、
一个完整的统计调查方案应包括哪些主要内容?
参考答案:
确定调查目的;确定调查对象和调查单位;确定调查项目,拟定调查表;确定调查时间和时限;确定调查的组织和实施计划。
42、统计数据收集过程中,可能有哪些误差?
参考答案:
数据收集过程中可能存在两种误差:
观测性误差和代表性误差。
(1)观测性误差(登记性误差或调查性误差),是在调查观测的各个环节因工作粗心,或被观测者不愿很好配合,而造成的所收集数据与实际情况不符的误差。
观测性误差在全面调查和非全面调查中都会产生。
(2)代表性误差实在抽样调查中,由于样本不能完全代表总体而产生的估计结果与总体真实数量特征不符的误差。
代表性误差又分为系统性代表性误差和偶然性代表性误差,系统代表性误差是指由于抽样框不完善,抽样违反随机原则,被调查者回答等因素引起的误差;系统性代表性误差通常难以计算和控制。
偶然性代表性误差是由于抽样的随机性引起的样本结构与总体结构不完全相符,从而产生的估计结果与总体真值不一致的误差;偶然性代表性误差不可避免,但是可以计算和控制。
抽样调查中的观测性误差和系统性误差统称为非抽样误差,而偶然性代表性误差称为抽样误差。
43、
1.
算术平均数、中位数和众数三者的数量关系说明什么样的变量分布特征?
2.
参考答案:
(1)在变量分布完全对称(正态分布)时,中位数、众数和算术平均数三者完全相等。
(2)在变量分布不对称(偏态分布)时,中位数、众数和算术平均数三者之间存在着差异。
当算术平均数受极大标志值一端的影响较大的时,变量分布向右偏,三者之间的关系为:
Mo 当算术平均数受极小标志值一端的影响较大的时,变量分布向左偏,三者之间的关系为: 44、为什么强调运用回归分析研究经济问题要定性分析和定量分析相结合? 参考答案: 在回归模型的运用中,我们还强调定性分析和定量分析相结合。 这是因为数理统计方法只是从事物外在的数量表面上去研究问题,不涉及事物质的规定性,单纯的表面上的数量关系是否反映事物的本质? 这本质究竟如何? 必须依靠专门的学科研究才能下定论,所以,在经济问题的研究中,我们不能仅凭样本数据估计的结果就不加分析地说长道短,必须把参数估计的结果和具体经济问题以及现实情况紧密结合,这样才能保证回归模型在经济问题研究中的正确应用。 45、变量间统计关系和函数关系的区别是什么 参考答案: 变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。 46、什么是统计指标体系,有哪些表现形式? 参考答案: 反映同一总体多方面数量特征的,一系列相互联系的统计指标所形成的体系,就称为统计指标体系。 表现形式有,数学等式关系,相互补充关系,相关关系,原因、条件和结果关系。 47、序时平均数与静态平均数有何异同? 参考答案: 共同是: 两者均为平均数,都是反映现象数量的一般水平或代表性水平。 区别是: 静态平均数是把同质总体某一数量标志在某一时间的数量指标抽象化,从静态反映现象的一般水平或代表性水平,而序时平均数则把同一现象在不同时间上的差异抽象化,从动态上反映现象的一般水平或代表性水平。 序时平均数是根据时间数列来计算的,而一般平均数则通常由变量数列计算。 48、 如何理解统计分组的含义与性质 参考答案: 统计分组就是根据统计研究的目的和事物本身的特点,选择一定的标志(一个或多个),将研究现象总体划分为若干性质不同的组或类的一种统计研究方法。 统计分组具有以下性质: 首先,统计分组兼有分与合的双重功能,是分与合的对立统一。 其次,统计分组必须遵循“穷尽原则”和“互斥原则”,即现象总体中的任何一个个体都必须而且只能归属于某一组,不能出现遗漏或重复出现的情况。 第三,统计分组的目的是要在同质性的基础上研究总体的内在差异性,即尽量体现出分组标志的组间差异而缩小其组内差异。 第四,统计分组在体现分组标志的组间差异的同时,却可能掩盖了其他标志的组间差异,因此,任何统计分组的意义都有一定的限定性。 第五,统计分组的关键是分组标志的选择和分组界限的确定。 49、统计的含义与本质是什么 参考答案: 统计一词可以有三种含义,统计活动、统计数据和统计学。 统计的本质就是关于为何统计,统计什么和如何统计的思想。 50、环比发展速度和定基发展速度之间有什么关系? 参考答案: 1.定期发展速度等于各期环比发展速度的连乘积2.相邻两定基发展速度的商等于相应的环比发展速度。 51、某市调查400户居民家庭收入资料如下表: 人均月收入(元) 组中值 家庭户数 月收入 100—200 200—300 300—400 400—500 500—600 150 250 350 450 550 40 120 140 80 20 6000 30000 49000 36000 11000 合计 - 400 132000 试求全距,平均值 参考答案: 全距=600-100=500(元);平均值=132000/400=330(元) 52、六、某加油站经理希望了解驾车人士在该加油站的加油习惯。 在一周内,他随机地抽取100名驾车人士调查,得到如下结果: 平均加油量等于13.5加仑,样本标准差是3.2加仑,有19人购买无铅汽油。 试问: (1)以0.05的显著性水平来说,是否有证据说明少于20%的驾车者购买无铅汽油? (2)计算 (1)的p-值。 参考答案: 假设检验为 。 采用成数检验统计量 。 查出 =0.05水平下的临界值为1.64和1.65之间。 计算统计量值 ,因此z=-2.5<-1.65(<-1.64),所以拒绝原假设。 p值为0.00062(因为本题为单侧检验,p值=(1-F(|z|))/2)。 显然p值<0.05,所以拒绝原假设。 53、六、某加油站经理希望了解驾车人士在该加油站的加油习惯。 在一周内,他随机地抽取100名驾车人士调查,得到如下结果: 平均加油量等于13.5加仑,样本标准差是3.2加仑,有19人购买无铅汽油。 试问: (1)以0.05的显著性水平,是否有证据说明平均加油量并非12加仑? (2)计算 (1)的p-值。 参考答案: 假设检验为 。 采用正态分布的检验统计量 。 查出 =0.05水平下的临界值为1.96。 计算统计量值 。 因为z=4.6875>1.96,所以拒绝原假设。 对应p值=2(1-F(z)),查表得到F(z)在0.999994和0.999999之间,所以p值在0.000006和0.000001之间(因为表中给出了双侧检验的接受域概率,因此本题中双侧检验的p值=1-F(|z|),直接查表即得F(|z|))。 p值<0.05,拒绝原假设。 都说明平均加油量并非12加仑。 54、某牌号彩电规定无故障时间为10000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(a=0.01)? 参考答案: 假设检验为 (使用寿命有无显著增加,应该使用右侧检验)。 n=100可近似采用正态分布的检验统计量 。 查出 =0.01水平下的反查正态概率表得到临界值2.32到2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。 计算统计量值 。 因为z=3>2.34(>2.32),所以拒绝原假设,无故障时间有显著增加。 55、 对某地区120家企业按利润额进行分组,结果如表所示。 按利润额分组(万元) 企业数(个) 向上累计 200—300 300—400 400—500 500—600 600以上 19 30 42 18 11 19 49 91 109 120 合计 120 计算120家企业利润的众数、中位数和均值; 参考答案: 众数= (万元) 中位数= (万元) 均值=426.67(万元),标准差=116(万元) 56、某汽油站有两种商标的汽油A和B,某天售出的50桶汽油可按商标A和B排成这样的顺序: AABAABABBAAABBABBABBABBAB AABBBBAABABABAAABAAAAABB 试问: 在显著性水平a=0.05条件下,这一序列是否有随机性? 参考答案: 因为A(8个),AA(4个),AAA(2个),AAAAA(1个),B(7个),BB(6个),BBBB(1个)。 n1=27,n2=23。 假设检验H0: 样本为随机样本,H1: 样本为非随机样本。 求出游程总和。 R1=15,R2=14,R=29。 因为 , 构造统计量 。 由于 =0.05的临界值为1.96,z=0.909<1.96,所以接受原假设,序列是随机的。 57、某市全部职工中,平常订阅某种报纸的占40%,最近从订阅率来看似乎出现减少的现象,随机抽200户职工家庭进行调查,有76户职工订阅该报纸,问报纸的订阅率是否显著降低(a=0.05)? 参考答案: 假设检验为 。 采用成数检验统计量 。 查出 =0.05水平下的临界值为1.64和1.65之间。 计算统计量值 ,z=-0.577>-1.64,所以接受原假设。 p值为0.48和0.476之间(因为本题为单侧检验,p值=(1-F(|z|))/2)。 显然p值>0.05,所以接受原假设,抽样没有表明报纸订阅率显著下降。 58、某市调查400户居民家庭收入资料如下表: 人均月收入(元) 组中值 家庭户数 月收入 100—200 200—300 300—400 400—500 500—600 150 250 350 450 550 40 120 140 80 20 6000 30000 49000 36000 11000 合计 - 400 132000 试求标准差,标准差系数 参考答案: 标准差=102.96(元) 标准差系数=102.96/330=0.312 59、 对某地区120家企业按利润额进行分组,结果如表所示。 按利润额分组(万元) 企业数(个) 向上累计 200—300 300—400 400—500 500—600 600以上 19 30 42 18 11 19 49 91 109 120 合计 120 计算分布的偏态系数和峰度系数。 参考答案: 分布的偏态系数SKp= 峰度系数= 60、 计算分析题(要写出主要的计算步骤,否则不得分。 ) 1.从一群成年人和一群幼儿中各随机抽取10名,对他们的身高(cm)进行调查,这10名儿童的身高分别是(cm): 68、69、68、72、71、78、72、72、74、80。 要求: (1)确定这组儿童身高的中位数和众数; (2)计算这组儿童身高的算术平均数; (3)计算这组儿童身高的标准差; (4)若成年组的平均身高为174cm,标准差为3.87cm。 请计算恰当的指标,并比较分析哪一组人群的身高差异大。 2.某市随机抽取100名职工,对其月收入进行了调查,经整理资料如下: 月收入(元) 人数(人) 2000以下 18 2000-3000 62 3000-5000 20 合计 100 根据以上资料,要求: (1)计算各组月收入的组中值; (2)确定100名职工月收入的算术平均数; (3)计算100名职工月收入的标准差。 3.已知某商场三种产品的销售资料如下: 产品 名称 价格(元) 销售量 2013年 2014年 2013年 2014年 甲 乙 丙 7 10 8 7 8 6 50 60 80 40 60 90 合计 - - - - 要求: (1)计算价格总指数,并说明其经济意义; (2)计算销售量总指数,并说明其经济意义; (3)计算由于价格的上升(或下降)而增加(或减少)的销售额; (4)计算由于销售量的上升(或下降)而增加(或减少)的销售额。 4.某公司2014年6-12月的职工人数和产品销售收入资料如下表: 月份 6 7 8 9 10 11 12 销售收入 (万元) 280 300 310 315 325 340 360 月末职工人数(人) 165 168 180 176 186 192 206 要求: (1)计算该公司2014年第四季度平均职工人数; (2)计算该公司2014年下半年平均每月的销售收入。 参考答案: 解1.<\/P> (1)<\/P> 中位数: <\/P> 首先将这10名儿童的身高由低到高排序: 68、68、69、71、72、72、72、74、78、80;<\/P> 其次求中间位置,为(10+1)/2=5.5位;<\/P> 由于第五和第六中间位中间位置,所以将第五位和第六位的身高值平均即为中位数: (72+72)/2=72cm。 <\/P> 众数: <\/P> 因为这10名儿童中有3位的身高都是72cm,出现的次数最多,所以儿童身高的众数是72cm。 <\/P> (2)这组儿童身高的算术平均数<\/P> =(68+69+68+72+71+78+72+72+74+80)/10=72.4cm。 <\/P> (3)这组儿童身高的标准差<\/P> ={[(68-72.4)平方+(69-72.4)平方+(68-72.4)平方+(72-72.4)平方+(71-72.4)平方+(78-72.4)平方+(72-72.4)平方+(72-72.4)平方+(74-72.4)平方+(80-72.4)平方]/10}开方=3.80cm。 <\/P> (4)由于成年组和儿童组的平均身高不同,因此应该用标准差系数比较身高的差异程度。 <\/P> 成年组的身高标准差系数=3.87/174=2.2%<\/P> 儿童组的身高标准差系数=3.80/72.9=5.2%<\/P> 由于儿童组身高的标准差系数较高,所以身高差异比成年组大。 <\/P> <\/P> 解2.<\/P> (1)三个组的组中值分别为: <\/P> (1000+2000)/2=1500<\/P> (2000+3000)/2=2500<\/P> (3000+5000)/2=4000<\/P> (2)100名职工月收入的算术平均数<\/P> =(1500*18+2500*62+4000*20)/100=2620元; (3)100名职工月收入的标准差<\/P> ={【(1500-2620)平方*18+(2500-2620)平方*62+(4000-2620)平方*20】/100}开平方=786元。 <\/P> 解3.<\/P> (1)2014年价格总指数<\/P> =(7×40+8×60+6×90)/(7×40+10×60+8×90) =1300/1600 =81.25%<\/P> 经济意义: 计算结果表明,2014年三种商品销售价格平均比2011年下降了18.75%。 <\/P> (2)2014年销售量总指数<\/P> =(40×7+60×10+90×8)/(50×7+60×10+80×8) =1600/1590 =100.63%<\/P> 经济意义: 计算结果表明,2014年三种商品销售量比2011年增长了0.63%。 (3)1300-1600=-300(元) 即由于价格的下降而减少的销售额为300元。 (4)1600-1590=10(元)<\/P> 即由于销售量的上升使销售额增加了10元。 <\/P> 解4.<\/P> (1)2014年第四季度平均职工人数=(176/2+186+192+206/2)/3=189.7(人)<\/P> (2)2014年下半年平均每月的销售收入=(300+310+315+325+340+360)/6=325(万元)<\/P> --[if! supportLineBreakNewLine]--> --[endif]--><\/P> <\/P> <\/P> <\/P> <\/P> 窗体顶端 窗体底端
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学基本知识 9062 统计学 基本知识