统计学思考题图文稿.docx
- 文档编号:24735148
- 上传时间:2023-06-01
- 格式:DOCX
- 页数:9
- 大小:30.08KB
统计学思考题图文稿.docx
《统计学思考题图文稿.docx》由会员分享,可在线阅读,更多相关《统计学思考题图文稿.docx(9页珍藏版)》请在冰豆网上搜索。
统计学思考题图文稿
集团文件发布号:
(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-19882)
统计学思考题
思考题:
1、什么是统计学怎样理解统计学与统计数据的关系
答:
⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究;
⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。
2、简要说明统计数据的来源。
答:
(1)统计数据来源于直接获取的数据和间接获取的数据;
(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。
3、简要说明抽样误差和非抽样误差。
答:
(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。
它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。
从理论上看,这类误差是可以避免的;
(2)抽样误差是利用样本推断总体时产生的误差。
抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。
4、怎样理解均值在统计学中的地位?
答:
(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;
(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。
5、解释洛伦茨曲线及其用途。
答:
(1)洛伦茨曲线是累积次数分配曲线,“二八原理”和收入分配公式绘制;
(2)用于描述收入和财富分配性质。
6、简述基尼系数的使用。
答:
基尼系数用于反应收入分配的变化情况,取值在0~1之间
①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4是收入分配不公平的警戒线,超过0.4,收入分配不公平。
7、一组数据的分布特征可以从哪几个方面进行测度?
答:
可以从三个方面测度:
⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。
8、简述频率与概率的关系。
答:
①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性;③当观察次数n很大时,频率与概率非常接近。
9、概率的三种定义各有什么应用场合。
答:
⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。
10、概率密度函数和分布函数的联系与区别表现在哪些方面?
答:
(1)联系:
概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;
(2)区别:
概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。
11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同?
答:
⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。
最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布;
⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。
最常见的连续型随机变量的概率分布有正态分布、均匀分布等。
12、正态分布所描述的随机现象有什么特点为什么许多随机现象服从或近似服从正态分布
答:
⑴正态分布所描述的随机现象的特点:
①对称的分布;②中间多两端少;
⑵许多随机现象的分布都会有集中趋势和离散趋势,即现象的分布表现为中间多两端少的特点,这种分布与正态分布十分贴近。
13、解释总体分布、样本分布和抽样分布的含义。
答:
①总体分布是指总体的全部观察值形成的分布;②样本分布是指一个样本的所有观察值形成的分布;③抽样分布就是由样本观察值计算的统计量的概率分布。
14、解释中心极限定理的含义。
答:
⑴样本来自于任意总体,样本容量充分大;⑵当样本容量充分大时,样本均值的抽样分布近似于一个均值
和方差
的正态分布。
15、简述评价估计量好坏的标准
答:
①无偏性 估计量抽样分布的数学期望等于被估计的总体参数;②有效性 无偏估计量与总体参数的离散程度;③相合性 随着样本容量的增大,估计量与总体参数的接近程度。
16、解释置信水平的含义。
答:
⑴对总体参数进行区间估计时给定的一个概率值;⑵反应总体参数包括在置信区间的概率。
17、简述样本容量与置信水平、总体方差、允许误差的关系。
答:
①样本容量与置信水平成正比;②样本容量与总体方差成正比;③样本容量与允许误差成反比。
18、第Ⅰ类错误和第Ⅱ类错误分别是指什么它们发生的概率大小之间存在怎样的关系
答:
⑴第Ⅰ类错误是指当原假设为真时拒绝原假设所犯的错误;⑵第Ⅱ类错误是指当原假设为假时没有拒绝原假设所犯的错误;⑶两类错误的概率之间的关系:
增大时,减小;增大时,减小。
19、什么是显着性水平它对于假设检验决策的意义是什么
答:
(1)显着性水平是指假设检验中犯的第Ⅰ类错误的概率,记为;
(2)显着性水平所围成的区域成为拒绝域;(3)检验统计量落在拒绝域则拒绝原假设的概率,是人们事先指定的犯第Ⅰ类错误概率的最大允许值。
20、分别列出小样本情形下总体均值左侧检验、右侧检验及双侧检验的拒绝域。
答:
(1)方差已知左侧检验为(-∞,-z),右侧检验为(z,+∞),双侧检验为(-∞,-z/2)(z/2,+∞);
(2)方差未知左侧检验为(-∞,-t),右侧检验为(t,+∞),双侧检验为(-∞,-t/2)(t/2,+∞)。
21、什么是统计上的显着性?
答:
(1)由于随机因素的作用,点估计量与假设的总体参数出现差异是可以理解的;
(2)点估计量与假设的总体参数出现较小差异是大概率事件,出现过大差异是小概率事件;(3)在一次试验中,点估计量与假设的总体参数出现差异过大是不正常的,这就是统计上的显着性。
22、方差分析中有哪些基本假定
答:
①每个总体都应服从正态分布;②各个总体的方差σ2必须相同;③观测值是独立的。
23、简述方差分析的基本思想。
答:
①将观测值之间的差异分为两类:
组内误差和组间误差;②组内误差只包含随机误差,组间误差既包括随机误差,也包括系统误差;③衡量组内误差与组间误差的大小,推断观测值之间差异产生的原因。
24、方差分析包括哪些类型它们有何区别
答:
⑴主要是两种类型:
单因素反差分析和双因素方差分析,双因素方差分析又分为无交互作用和有交互作用的方差分析两类;⑵区别之一是考虑因素的数目不同;⑶区别之二是两个因素是否有交互作用。
25、解释方差分析中的水平项平方和、误差项平方和的含义。
答:
⑴水平项误差平方和是各组平均值与总平均值的误差平方和,反映各总体的样本均值之间的差异程度;⑵误差项平方和是每个水平或组的各个样本数据与其组平均值误差的平方和,反映了每个样本各观测值的离散状况即反映随机误差的大小
26、解释试验、试验设计、试验单元的含义?
答:
(1)试验是指收集样本数据的过程;
(2)试验设计是研究如何科学地安排试验,使人们能用尽可能少的试验获得尽可能多的信息;(3)试验单元是指接受“处理”的对象或实体。
27、简述相关分析与回归分析的联系。
答:
(1)具有共同的研究对象,都是对变量间相关关系的分析,两者可以相互补充;
(2)只有当变量间存在相当程度的相关关系时,进行回归分析去寻找变量间相关的具体数学形式才有实际的意义;(3)相关分析中相关系数的确定建立在回归分析的基础上。
28、简述相关分析与回归分析的区别。
答:
(1)相关分析是用一定的数量指标度量变量间相互联系的方向和程度,回归分析是寻找变量间联系的具体数学形式,是要根据自变量的固定值去估计和预测因变量的平均值;
(2)相关分析对称的对待相互联系的变量,不考虑二者的因果关系;回归分析对变量的处理是不对称的,必须明确划分自变量和因变量;(3)相关分析的两个变量均视为随机变量;回归分析中通常假定自变量为取固定值的非随机变量,因变量为随机变量。
29、什么是随机误差项和残差它们之间的区别是什么
答:
⑴随机误差项是指因变量的观测值
与其相应的条件期望值
的偏差;⑵残差是指因变量的实际样本观测值
与样本条件期望
的偏差。
⑶随机误差不能直接观测,残差可以直接计算。
30、什么是总体回归函数和样本回归函数它们之间的主要区别是什么
答:
⑴总体回归函数是指总体因变量的条件期望表示为自变量的某种函数;
⑵样本回归函数是指把因变量的样本条件期望表示为自变量的某种函数
⑶它们的主要区别是总体回归函数是确定的,样本回归函数随样本波动而变化。
31、为什么在对参数进行最小二乘估计时,要对模型提出一些基本的假定?
答:
①基本假定有:
零期望值、同方差、无自相关、随机扰动与自变量不相关、正态性等假定;②在基本假定满足的条件下,回归系数的最小二乘估计是最佳线性无偏估计;③如果多次进行估计值计算,或者是扩大样本容量进行估计值计算,按最佳估计方式计算的估计值接近真实值的可能性最大。
32、为什么对计算的样本相关系数还要进行检验?
答:
(1)样本相关系数是根据从总体中抽取的随机样本的观测值计算出来的,它只是对总体相关系数的估计;
(2)样本相关系数是随抽样而变动的随机变量,必需对估计的样本相关系数是否为抽样的偶然结果做出判断。
33、为什么用可决系数能够度量回归方程对样本数据的拟合程度?
答:
(1)回归方程是通过对样本数据拟合而得到,在散点图上,样本回归线与样本观测值总是一定程度上存在或正或负的偏离,即拟合的优劣程度;(3)可决系数表示回归平方和占总离差平方和的比重;(4)如果样本回归线对样本观测值拟合程度越好,各样本观测点与回归线靠得越近,由样本回归作出解释的离差平方和在总离差平方和中占的比重也将越大,反之拟合程度越差,这部分占的比重越小;
34、利用回归方程作经济预测的基本条件和前提是什么?
答:
(1)变量分为因变量和解释变量两类,它们之间存在因果关系;
(2)建立的回归方程通过各项统计检验,并且在经济上有实际意义;(3)影响经济现象的因素及条件始终保持不变。
35、为什么对用回归方程计算的预测值要作区间估计?
答:
(1)由样本回归函数计算的
只是对yf的平均值做的点估计;
(2)回归方程中
和
是随机变量,因而
也是随机变量;(3)对平均值的点估计
不一定等于因变量预测值的真实个别值yf,需要对yf可能的置信区间作出预测。
36、对回归系数显着性作t检验的基本思想是什么?
答:
(1)回归分析中,最基本的是简单线性回归,人们最关心的是自变量x对因变量y是否有显着线性影响;
(2)回归系数显着性检验的原假设是H0:
=0,若不拒绝原假设,表明x对y没有显着的线性影响,若拒绝原假设,表明x对y存在显着的线性影响;(3)随机扰动项ui的方差2未知,且样本量较小,统计量
服从t分布,只能采用t检验法进行双侧检验。
37、总指数的基本编制方式。
答:
①先综合、后对比的方式就是先将各种商品的价格或销售量资料加总起来,然后通过对比得到相应的总指数;②先对比、后平均的方式就是先将各种商品的价格或销售量资料进行对比,然后通过个体指数的平均得到相应的总指数。
38、简述统计指数与数学上的指数函数有何不同。
答:
①统计学中的指数是一种对比性的分析指标;②可以反映不同时间、不同空间现象水平的数量对比关系;③再经济分析的各个领域得到广泛应用,又称为“经济指数”。
39、与一般相对数比较,总指数所研究现象总体有何特点?
答:
⑴一般反映的是多种现象的综合变动;⑵在经济领域应用广泛,被称为“经济指数”;⑶通常是指不同时间的现象水平的对比。
40、相对于简单形式的总指数,加权指数有何优点?
答:
(1)总指数是考察复杂现象总体数量对比关系的指数;
(2)简单形式的总指数是指在处理复杂现象总体时,对各个现象不加区分,同等对待,进行简单的综合;(3)加权指数是指在计算总指数时依据各个现象重要性的差别,对各个现象加以综合。
加权指数能真实的反映研究现象总体的数量对比关系。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 思考题 图文