《统计与计量分析》答案-190616(2).docx
- 文档编号:26874001
- 上传时间:2023-06-23
- 格式:DOCX
- 页数:8
- 大小:198.26KB
《统计与计量分析》答案-190616(2).docx
《《统计与计量分析》答案-190616(2).docx》由会员分享,可在线阅读,更多相关《《统计与计量分析》答案-190616(2).docx(8页珍藏版)》请在冰豆网上搜索。
《统计与计量分析》试题库
一、简答题
1.获得数据的概率抽样方法有哪些?
(1)简单随机抽样
简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。
它最直观地体现了抽样的基本原理,是最基本的概率抽样。
(2)系统抽样
系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法。
(3)分层抽样
分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体样本。
(4)整群抽样
整群抽样又称聚类抽样或集体抽样,是将总体按照某种标准划分为一些群体,每一个群体为一个抽样单位,再用随机的方法从这些群体中抽取若干群体,并将所抽出群体中的所有个体集合为总体的样本。
(5)多阶段抽样
多阶段抽样又称多级抽样或分段抽样,就是把从总体中抽取样本的过程分成两个或多个阶段进行的抽样方法。
2.请说明平均数、中位数和众数的特点及应用场合。
平均数
是一组数据相加后除以数据的个数得到的结果,是集中趋势的最主要测度值。
它易受极端值影响,数学性质优良。
主要适用于数值型数据,而不适用于分类数据和顺序数据。
数据对称分布或接近对称分布时应用。
中位数
是一组数据排序后处于中间位置上的变量值,不受极端值影响。
它将全部数据等分成两部分,一部分数据比中位数大,一部分比中位数小。
主要用于测度顺序数据的集中趋势,当然也适用于数值型数据,但不适用于分类数据。
数据分布偏斜程度较大时应用。
众数
是一组数据中出现次数最多的变量值。
它不受极端值影响,具有不唯一性。
众数主要用于分类数据的集中趋势,当然也适用顺序数据和数值型数据。
数据分布偏斜程度较大时应用。
3.请解释中心极限定理的含义。
中心极限定理是研究独立随机变量和的极限分布为正态分布的问题。
它是概率论中最重要的一类定理,有广泛的实际应用背景。
中心极限定理是概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。
这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量积累分布函数逐点收敛到正态分布的积累分布函数的条件。
4.请解释置信水平的含义。
置信水平是指特定个体对待特定命题真实性相信的程度,也就是概率是对个人信念合理性的量度。
一般用1-α表示。
概率的置信度解释表明,事件本身并没有什么概率,事件之所以指派有概率只是指派概率的人头脑中所具有的信念证据。
置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。
置信区间越大,置信水平越高。
5.第I类错误和第II类错误分别是指什么?
它们发生的概率的大小之间存在怎样的关系?
当原假设为真时拒绝原假设,所犯的错误称为第Ⅰ类错误,又称为弃真错误,犯第Ⅰ类错误的概率通常记为a。
当原假设为假时没有拒绝原假设,所犯的错误称为第Ⅱ类错误,又称为取伪错误,犯第Ⅱ类错误的概率通常记为b。
两者发生的概率的关系:
当a增大时,b减小;当b增大时,a减小。
6.什么是P值?
利用P值进行检验与利用统计量进行检验有什么不同?
P值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。
P值常常作为观察到的数据与原假设不一致程度的度量。
统计量检验采用事先确定显著性水平α,来控制犯第一类错误的上限,P值可以有效地补充α提供的关于检验可靠性的有限信息。
P值检验的有点在于,它提供了更过的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显著性。
7.请说明内生变量与外生变量的区别。
内生变量是具有某种概率分布的随机变量,其数值是在所研究的经济系统的模型内决定的,其参数是联立方程模型估计的元素。
内生变量是由模型系统决定的,同时也对模型系统产生影响。
内生变量一般为经济变量。
外生变量一般是确定性变量,或是具有临界概率分布的随机变量,其数值是在所研究的经济系统的模型之外决定的,其参数不是模型系统研究的元素。
外生变量影响系统但不受系统影响。
外生变量一般是经济变量,条件变量,政策变量,虚变量。
8.我国1998年至2016年的季度通货膨胀率数据属于什么数据(时间序列,面板数据,还是截面数据)?
时间序列数据是指对一个或几个变量跨期观察得到的数据。
也就是按固定的时间间隔观察某个对象的属性或变量的取值。
面板数据也称纵列数据,是对若干固定对象的属性或变量值追踪观察而得到的数据,跟踪观察一般是按固定时间间隔的跨期观察。
截面数据是指一个变量或多个变量再某个时点的数据集。
也就是说在同一个时间点观察多个对象的某个属性或变量取值。
我国1998年至2016年的季度通货膨胀率数据属于时间序列数据。
9.在回归模型中,对变量取对数的好处是什么?
好处有很多,其中包括:
1.减弱模型中数据的异方差性,只能是减弱,并不能彻底消除。
2.模型形式的需要,利用线性回归模型的前提是解释变量和被解释变量之间的现行关系,但是在实际中这一点很难满足,很多的时候需要对多个变量或者是单一变量做对数变换,让模型的形式变为线性。
3.取对数,再配合差分变化,把绝对数变成相对数,这样,数据更能表示变动的相关性。
4.有时候变量不符合正态分布的假定,取了对数可以渐近正态分布。
10.请说明回归模型做预测和因果关系分析时基本假设的异同。
(未找到确定答案)
二计算题
1.某大学的商学院为了了解毕业生的就业去向,分别从会计专业抽取50人、从市场营销专业抽取30人、从企业管理专业抽取20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?
(2)样本量是多少?
(1)分层抽样
(2)样本量=50+30+20=100
2.一家公司在招收职员时,首先要通过两项能力测试。
在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。
一位应试者在A项测试中得了115分,在B项测试中得了425分。
与平均分数相比,该位应试者哪一项测试更为理想?
A:
(115-100)/15=1,因此A项测试高于平均分1个标准差
B:
(425-400)/50=0.5,因此B项测试高于平均分半个标准差,A项测试更理想
3.从均值为200、标准差为50的总体中,抽取n=100的简单随机样本,用样本均值x估计总体均值。
(1)x的期望值是多少?
(2)x的标准差是多少?
(3)x的概率分布是什么?
(1)E(样本均值)=E(总体均值)=200,因此,x的期望值是200
(2)σ=50,x的方差为σ2n=25,标准差为σ2n=5
(3)x的概率分布是正态分布
4.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(a)假定总体的标准差为15元,求样本均值的标准误差。
(b)在95%的置信水平下,求估计误差。
(c)如果样本均值为120元,求总体均值μ的置信区间。
(a)总体标准差σ=15,样本均值的标准差为σn=157=2.143
(b)置信水平1-α=0.95,Zα2=1.96,估计误差∆x=1.96*2.143=4.2
(c)置信区间为(x-∆x,x+∆x)=(115.8,124.2)
5.某超市想要估计每个顾客平均每次购物花费的金额。
根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求估计误差不超过20元,应抽取多少个顾客作为样本?
已知总体标准差σ=120,由置信水平1-α=0.95,Zα2=1.96,允许误差E≤20,由允许误差公式E=Zα2*σn,n=σ*Zα2E2≥1.96*120202=138.2976,为保证使“≥”成立,至少应取139个顾客作为样本。
6.对消费者的一项调查表明,17%的人早餐饮料是牛奶。
某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。
为了验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。
在α=0.05显著性水平下,检验该生产商的说法是否属实。
1-α=0.95;Zα/2=1.96
H0:
π≦17%,H1:
π>17%,Z=2.25;P=0.0121,
拒绝,该生产商的说法属实。
H0
7.在模型Yi=β0+β1X1+β2X2+β3X1×X2+ui中,X1对Y的边际效应为多少?
8.如何解释模型Yi=β0+β1lnX1+ui中斜率系数β1?
9.以下哪个问题不能通过Probit回归模型进行估计:
(a)哪些学生会选择出国留学
(b)蓝领工人的工资是否存在性别差异
(c)家庭收入是否会影响其生二胎的决定
(d)消费者是否选择使用移动支付可能受到哪些因素的影响
b,d
10.假如你想研究广州连续两年天气之间的关系。
你把2016年的任意100天的温度数据作为因变量,把与之相对应的2015年的温度数据作为解释变量(例如,如果因变量为2016年1月11日的广州温度,则解释变量为2015年1月11日的广州温度),进行最小二乘回归。
结果如下:
2016年广州温度=5.00+0.80×2015年广州温度,R2=0.65,SER=9.63
(0.80)(0.10)
(a)根据以上回归方程,当2015年广州的温度分别为10,25,40摄氏度时,你预测的2016年相应日期的广州的温度各为多少摄氏度?
(b)说明上述结果是否与你的预期相同。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计与计量分析 统计 计量 分析 答案 190616