人大统计学专业课初试题Word格式文档下载.docx
- 文档编号:20198199
- 上传时间:2023-01-17
- 格式:DOCX
- 页数:19
- 大小:56.66KB
人大统计学专业课初试题Word格式文档下载.docx
《人大统计学专业课初试题Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《人大统计学专业课初试题Word格式文档下载.docx(19页珍藏版)》请在冰豆网上搜索。
(3)(5)在产量变动的差异中,被地块所解释的百分比是多少?
(3)(6)上面的分析包含哪些假定?
(10)五、(30分)统计资料表明,某地区职工年人均病假天数为5.1天。
某公司从本公司职工中随机抽取了46名职工作为样本,测得其平均病假天数为7天,样本标准差为2.5天。
公司领导想知道本公司职工是否比其他单位的职工更容易生病。
(1)公司领导感兴趣的原假设和替换假设是什么?
(3)
(2)若令=0.05,请用假设检验的方法帮助公司领导作出判断(写清检验步骤,并作示意图)。
(10)(z/2=1.96,z=1.645,t/2(45)=2.0141,t(45)=1.6794)(3)在假设检验中,P值代表什么含义?
(6)(4)在本例中,P=0.001说明了什么?
(3)(5)用区间估计的方法找出该公司职工病假天数与其他职工病假天数显著不同的临界点。
(8)六、(30分)关于回归分析讨论下列问题:
(1)画出回归建模步骤的流程图;
(7)
(2)简要描述各个步骤的内容;
(8)(3)设是多元回归方程参数的最小二乘估计,证明;
(8)(4)由,结合一元线性回归,你能看出对建模有指导意义的什么信息(7)2004年人大统计学专业课初试题本试卷分为两部分,一部分为必答题,计105分,一部分为选答题,计45分。
第一部分必答题1.(25分)下面是A、B两个班学生的数学考试成绩数据:
A班:
557666857562797393766785746178719279658373577770907563817396B班:
3471569066488158967155856244795795685484613973579468518261100
(1)将两个班的考试成绩用一个公共的茎制成茎叶图,比较两个班考试成绩分布的特点;
(2)两个班考试成绩的描述统计量如下,试进行比较分析:
A班B班平均75中位数75众数73标准偏差10.44样本方差108.90峰值-0.35偏斜度0.11极差41最小值55最大值96平均68中位数67众数57标准偏差17.64样本方差311.10峰值-0.76偏斜度0.11极差66最小值34最大值100(3)要判断考试成绩是否有离群点,可使用哪些方法?
(4)要判断考试成绩是否服从正态分布,可使用那些描述性方法?
2.(25分)某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每人使用其中的一种方法。
通过Excel进行方差分析得到下面的部分结果:
方差分析表差异源SSdfMSFP-valueFcrit组间2100.2459463.354131组内3836总计29
(1)完成上面的方差分析表;
(2)若显著性水平=0.05,检验三种方法组装的产品数量之间是否有显著性差异;
(3)在上面的方差分析中包含了哪些基本假定?
(4)简述多重比较的前提和作用。
3.(20分)一袋中有黑、白两种球,p表示白球所占的比例,待检验假设为H0:
p=1/2;
H1:
p=1/5。
从袋中任取4个球(放回抽样),当白球数小于2时,拒绝原假设。
试给出以下内容:
(1)总体及其分布;
(2)样本量n;
(3)拒绝域;
(4)第一类错误的概率。
4.(15分)试举例说明方差分析中效应的意义和用效应如何表达它的数学模型。
5.(20分)试证明正态线性回归模型其回归系数的最大似然估计与最小二乘估计相同。
第二部分选答题(在下面五道题中任选三道题)6.(15分)下表是中国1992和2002两个年份国民经济核算的部分资料。
(1)根据资料,计算反映经济发展状况的基本总量指标和结构比例指标;
(2)根据计算结果,对10年间中国经济发展特征及其变化予以简要说明。
中国国民经济核算有关资料单位:
亿元1992年2002年第一产业增加值第二产业增加值第三产业增加值最终消费货物服务净出口58001170091381595227614161175354035133623652794-1237来自国外要素收入净额平均人口总数(亿人)11.6412.807.(15分)2003年7月,中央政府和香港特区政府签定了简称CEPA的内地与香港关于建立更紧密经贸关系的安排。
其中内容之一是自2004年起,273种香港原产货物进入内地市场实行零关税;
内容之二是放宽香港企业对内地投资的限制,包括投资的行业、注册资本数额和资质条件等。
可以预见,由此将大大促进香港对内地的贸易和投资活动。
根据上述贸易和投资两方面的内容,应用国际收支平衡表原理,说明中国未来国际收支所产生的影响。
(说明:
根据目前中国国民经济核算,仍将香港作为“非常住单位”,即作为“境外”看待。
)8.(15分)假定某地区人口和劳动力就业统计数据如下表所示,要求:
(1)计算有关指标,描述该地区人口基本结构状况;
(2)计算有关指标,描述该地区人口变动状况;
(3)计算有关指标,描述该地区劳动就业状况。
单位:
万人指标数值年末常住人口数其中:
女性人口数其中:
15岁及以上人口数其中:
城市人口数其中:
文盲人口数当年平均常住人口数当年出生人口数当年死亡人口数当年净迁出人口数年末社会劳动力资源总数年末就业人数年末失业人数128462399050211512802791986860559.(15分)对(30)的1000元3年定期寿险,死亡年末给付,保费在两年内每年缴一次。
已知预定利率为5%,q30=0.02,q31=0.03,q32=0.04,假设费用发生在保年初,各年费用为:
年份每份保单每1000元保额占总保费的比例1102.50.10251.00.05351.0赔付处理费发生在死亡年末,每1000保额为10元,假设有退保。
计算:
(1)每年总保费;
(2)第一年在总保费下的责任准备金。
10.(15分)某人在25岁时计划每年初存入200元建立个人账户,如果他在60岁退休,存款利率假设恒定为4%。
(1)求退休时个人账户的累计额;
(2)如果个人账户累计额在退休后以固定年金方式在30年内每月领取一次,求每月可以领取的数额。
2005年人大统计学专业课初试题15192224301619222431172023253418202327381921232941一、(15分)一家网吧想了解上网人员的年龄分布状况,随机抽取25人,得到他们的年龄数据
(1)画出该组数据的茎叶图;
(2)画出该组数据的箱线图;
(3)根据茎叶图和箱线图说明上网者年龄分布的特征。
二、(15分)设有三个总体的均值分别为:
1,2,3。
要检验三个总体的均值是否相等(=0.05),我们为什么不先将它们简单地配对,即H0:
1=2,H0:
1=3,H0:
2=3,然后分别进行检验,而是采用方差分析的方法?
三、(20分)某城市的餐饮管理协会估计,餐馆的月平均用水量为100吨,一家研究机构认为实际用水量要高于这个数字,该研究机构随机抽取了36家餐馆,记录了每个餐馆的月用水量(单位:
吨),经过初步计算得到样本数据的部分描述统计量如下:
平均107标准误差4.99样本标准差29.96样本方差897.77
(1)确定餐馆月平均用水量95%的置信区间;
(2)餐馆实际月平均用水量在你所建立的置信区间里吗?
请说明原因;
(3)如果要检验研究机构的看法是否正确,应该如何建立原假设和备择假设?
请谈谈拒绝和不拒绝原假设的含义;
(4)在上面的估计和检验中,你使用了统计中的哪一个重要定理?
请简要解释这一定理。
(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)四、(20分)一家房地产评估公司想对某城市的房地产销售价格(y)与地产评估价值(x1)、房产评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格做合理预测。
为此,收集了15栋住宅的房地产评估数据,经回归得到下面的有关结果(=0.05):
方差分析dfSSMSFSignificanceF回归370090029.0823363343.0348.620.00残差115285944.25480540.39总计1475375973.33Coefficient标准误差tStatP-valueIntercept207.9037617.04860.33690.7425XVariable11.43780.56452.54720.0271XVariable20.85450.26633.20910.0083XVariable30.06260.06560.95380.3607
(1)写出销售价格对地产评估价值、房产评估价值、使用面积的多元线性回归方程,并解释各回归系数的意义;
(2)检验回归方程的线性关系是否显著;
(3)检验各回归系是否显著;
(4)计算多重判定系数R2,并说明它的实际意义;
(5)计算估计标准误差sy,并说明它的实际意义;
(6)你认为使用面积(x3)在预测销售价格时是否有用?
试说明理由。
五、(42分)假设一个已知简单总体的全部真实数据列于下表:
编号1234567899.31.81.91.71.51.31.42.01.9
(1)绘出散点图;
(2)如果根据的数值将总体分成两个子总体,最好的分发是什么?
(3)举例说明上表数据所反映的现象可能是什么?
(4)计算出的总体均值和总体方差S2;
(5)四种基本抽样方式中最不适合上述总体情形的是哪一种?
并说明理由;
(6)对其余三种基本抽样方式,假定n=2,分别列出每一种方式所对应的全部可能样本,并计算样本均值的数学期望和方差;
(7)计算每一种方式在此情形下的设计效应,并说明其意义。
六、(8分)说明抽样里的回归估计与一般回归分析方法的联系与区别。
七、(6分)请解释下面的说法:
“生产核算的范围决定了收入分配和收入使用核算的范围”。
八、(9分)A、B两个地区的贫困线均为年收入1000元。
A地区有11%的人年收入900元,9%的人年收入200元;
B地区有1%的人年收入900元,9%的人年收入500元。
(1)根据上述数据,计算两地区的贫困者比重和贫困深度;
(2)
(2)请根据贫困者比重和贫困深度对两地区贫困状况进行简要的比较分析;
(4)(3)你觉得这两个指标能够准确反映两地区贫困状况的差异吗?
如果不能,应当如何改进(3)九、(15分)下面是某国某核算年度的国际收支平衡表(单位:
亿元):
一、经常账户差额A、货物与服务B、收益C、经常转移二、资本与金融账户A、资本账户B、金融账户三、储备资产四、误差与遗漏205230()-65()-40()-125-10
(1)在表中括号内填上适当的数字;
(3)
(2)请解释储备资产所对应的-125亿元的含义;
(3)(3)根据表中数字分析该国国内生产总值、国民总收入和国民可支配收入三者之间的关系(6)(4)根据表中数字,对于该国当年国内的投融资状况你能得出何种结论?
(3)2006年人大统计学专业课初试题一、(20分)某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:
一种是所有顾客都进入一个等待队列;
另一种是顾客在三个业务窗口处列队三排等待。
为比较那种排列方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:
分钟)如下:
5.56.66.76.87.17.37.47.87.8
(1)画出第二种排队方式等待时间的茎叶图;
(2)比较两种排队方式等待时间的离散程度;
(3)如果让你选择一种排队方式,你会选择哪一种?
二、(20分)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。
现从某天生产的一批产品中按重量重复抽样方式随机抽取50包进行检查,测得每包重量(单位:
克)如下:
每包重量/g包数96-9898-100100-102102-104104-106233474合计50已知食品包重量服从正态分布,要求:
(1)确定该种食品平均重量95%的置信区间;
(2)如果厂家认为每袋食品重量不低于100克,请写出检验的原假设和备择假设;
(3)利用P值进行检验和利用统计量进行检验有什么不同?
(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)三、(20分)一家汽车制造商准备购进一批轮胎,考虑的因素主要有轮胎供应商牌和耐磨程度。
为了对耐磨程度进行测试,分别在低速(40公里/小时),中速(80公里/小时),高速(120公里/小时)下进行测试。
根据对5家供应商抽取的轮胎随机样本对轮胎在行驶1000公里后磨损程度进行试验,在显著水平=0.01下得到的有关结果如下:
差异源SSdfMSFP-valueFcrit行列误差总计1.553.480.145.17428140.391.740.0221.7297.680.0002360.0000027.018.65
(1)不同的车速对磨损程度是否有显著影响?
(2)不同供应商的轮胎之间磨损程度是否显著差异?
(3)在上面的分析中,你都做了哪些假设?
四、(15分)说明什么条件下适合采取简单随机抽样?
五、(25分)说明回归模型的假设以及当这些假设不成立时的应对方法。
六、(20分)解释因子模型X=AF+的意义并写出模型的假设。
七、(15分)以下是从中国统计年鉴-2005摘引的资料,要求:
元/人2003年2004年人均国内生产总值城镇居民人均可支配收入农村居民人均纯收入9111847226221056194222936
(1)根据国民经济收入分配核算原理,说明居民人均收入低于人均GDP水平的原因;
(2)计算各指标的动态变动率(不考虑价格变化),对其结果予以简要分析。
八、(15分)下表是中国全部国有及规模以上非国有供企业统计的主要指标,要求:
(1)设计并计算反映企业经济效益的指标;
(2)对经济效益指标的动态变化状况做简要分析。
2003年2004年工业总产值(亿元)工业增加值(亿元)企业单位数(个)资产总计(亿元)流动资产年平均余额(亿元)固定资产净值年平均余额(亿元)负债合计(亿元)产品销售收入(亿元)产品销售成本(亿元)产品销售税金及附加(亿元)利润总额(亿元)本年应缴增值税(亿元)全部从业人员年平均人数(万人)142271419901962221688087148866008734141431721186382049833754885749187221548052194631952628688573849115529187815157071246711342639660992007年人大统计学专业课初试题一、(20分)下面是一种零件误差的数据(单位:
克):
6.14.76.56.27.76.45.57.16.15.35.76.15.34.04.83.23.91.94.93.85.32.65.35.55.82.76.87.45.63.3
(1)根据涉及t分布的计算,该数据所代表的总体均值的95%置信区间为(4.637785,5.728882)。
请问,若使该置信区间有意义,需要对总体进行何等假定?
这种假定能不能用数据证明?
是不是该区间以0.95的概率覆盖真实总体均值?
如果不是,说出理由及合适的说法;
(2)对于该数据所代表的总体的均值进行检验:
零假设为总体均值等于4.8克,备选假设为总体均值大于4.8克。
如果进行t检验,需要假定哪些条件?
t检验结果为p值等于0.0807。
能不能说“在显著性水平为0.05时,接受零假设”?
为什么?
你的结论是什么?
二、(20分)一家研究机构想估计在30个网络公司工作的员工每周加班的平均时间,为此进行抽样调查。
请回答以下问题:
(1)如果对这些员工进行随机电子邮件调查,由答复的邮件所得到的数据是不是简单随机样本?
(2)抽样调查中,说“响应误差总是人们不说实话导致的”对不对?
随机误差是不是可以避免的?
(3)这些员工的加班时间是否独立?
如果不是,原因可能是什么?
三、(20分)某城市交通管理部门的一项调查表明,该城市中驾车上班的人数超过30%。
但一家研究机构则认为自驾车上班的人数比例达不到这一水平。
为证明自己的这一看法,该研究机构准备抽取一个简单的随机样本进行检验。
(1)请写出检验的原假设和备择假设;
(2)请对小样本情况写出计算p值的公式,并论述你所依赖的分布。
对大样本情况,写出检验统计量的公式以及使该统计量有意义所需要的假定的条件;
(3)对于一般检验来说,如果结果表明“统计上显著”,是不是实际上也显著?
四、(10分)在对某项产品的认可的抽样调查报告中,如果报告仅仅说,“对该产品认可的有90%”,那么该报告是否负责?
一个负责任的调查报告应该给什么有关信息?
五、(10分)对于主成分分析,有人在进行了主成分分析之后,对得到的主成分又进行了第二次主成分分析,以得到更加精确的结果。
请问,这样做是否有道理?
请加以说明。
什么样的数据不适宜于主成分分析?
选择那些主成分累计方差贡献率为70-80%之类的准则是不是总是适用?
六、(20分)回归模型y=0+1x1+2x2+pxp+中的一定是随机误差吗?
如果回答是否定的,讨论在何种情况下,答案是肯定的?
此外,最小二乘回归是不是需要对误差项作出假定?
如果不是,那么在什么情况下需要对误差项作出假定?
作什么假定?
七、(25分)对于聚类分析,请回答以下问题:
(1)分层聚类前,需要对什么进行选择?
(2)描述分层聚类分析的详细步骤;
(3)描述K均值(快速)聚类分析的详细步骤。
八、(25分)应用多元线性回归模型y=0+1x1+2x2+pxp+,如果一个SPSS回归分析的结果如下表所示:
ANOVAModelSumofSquaresdfMeanSquareFSig.1RegressionResidualTotal106831048750.12431085446686.216137916495436.3401472473106831048750.12465858997.2171622.118.000a2RegressionResidualTotal111136313278.11826780182158.221137916495436.340247147355568156639.05956858136.217997.312.000ba.Predictors:
(Constant),BeginningSalaryb.Predictors:
(Constant),BeginningSalary,EmploymentCategory则:
(1)表中所用选择自变量的方法可能是什么?
(2)表中的最后一个Sig.如何求得?
意义是什么?
(3)请给出该表最后一个F所表示的统计量服从F分布所需要的假定条件,并对该统计量服从F分布予以证明。
2008年人大统计学专业课初试题一、(10分)07年香港一则报道说:
“随着经济的增长,香港低收入家庭的比例在增长,其中低收入的家庭是指低于中位数的家庭。
”请你从统计的角度对该报道做简要评论。
二、(10分)经常有人说方差分析是比较多个总体的均值是否相同,但为什么叫方差分析呢?
请谈谈你对方差分析的理解,并说明方差分析解决问题的基本思路。
三、(10分)如果时间序列在随时间变化的过程中既有趋势又有季节变动,你认为可以建立什么样的预测模型?
请你写出模型形式并加以简要说明。
四、(30分)食品厂家说:
净含量是每袋不低于250g。
但有消费者向消协反映不是250g,消协据此要求厂家自检,同时消协也从中随机抽取20袋检验。
(1)如果厂家自己检验,你认为提出什么样的原假设和备择假设?
(2)如果从消费者利益出发,你认为应该提出什么样的原假设和备择假设?
(3)消协抽取20袋,数据如下(略),得p值为0.4297,在=0.5的显著水平下,检验假设意味着什么?
p值的含义是什么?
(4)据样本数据得该食品每袋平均重量95%置信区间(241.1,257.5),你认为这种食品实际平均重量是否在该区间?
五、(15分)在经典的多元线性回归模型里,针对自变量事实上是有许多假设的。
(1)请具体指明这些假设有哪些?
(2)说明这些假设所发挥的主要作用;
(3)请讨论这些假设最终产生的影响。
六、(15分)在有关统计知识方面内容的中学课本里编者认为基本的抽样方式只有三种,并不包括整群抽样,请说明你
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人大 统计学 专业课 初试