统计学主观题答案文档格式.docx
- 文档编号:14913395
- 上传时间:2022-10-25
- 格式:DOCX
- 页数:16
- 大小:1.20MB
统计学主观题答案文档格式.docx
《统计学主观题答案文档格式.docx》由会员分享,可在线阅读,更多相关《统计学主观题答案文档格式.docx(16页珍藏版)》请在冰豆网上搜索。
根据不同的样本,可以得到不同的观测结果。
抽样误差并不是针对某个具体样本检测结果与真实结果的差异而言,所以抽样误差是样本可能的结果与总体真值的平均差异。
抽样误差与多方面的因素有关,样本量越大,抽样误差就越小。
抽样误差还与总体的变异有关。
抽样平均误差的公式为。
抽样误差又分为组内误差和组间误差。
组内误差即为来自水平内部的数据误差,组间误差为不同水平之间的数据误差。
组内误差只含随机误差,组间误差是随机误差和系统误差的总和。
请举例说明统计学上所计算的抽样误差与我们平常说想象的抽样误差有什么不同?
抽样误差是由于样本随机性引起的样本结果与总体真值之间的误差。
我们平时想像的抽样误差可能是针对某个具体的样本的检测结果与总体真实结果的差异而言的。
然后统计学上的抽样误差描述的是所有样本可能的结果与总体真值之间的平均性差异。
3.例如:
95%的样本结果与真值之间的差异上下不超过2%的范围。
按照平常的理解,真值并不知道则无法得出这样的结论。
而在统计学上,我们发现对不同样本进行检测时其分布是有规律的,于是可以通过样本的信息计算出这个误差。
如果真实值为10%,则样本结果95%会落在8%-12%内。
那么以10%为中心,结果在2%的范围内波动,这是统计学上的抽样误差。
简述影响抽样误差大小的因素。
抽样误差:
指由于抽样的随机性引起的样本结果与总体真值之间的误差。
影响抽样误差的大小如下:
①抽样单位的数目。
在其他条件不变的情况下,抽样单位的数目越多,抽样误差越小;
抽样单位数目越少,抽样误差越大。
这是因为随着样本数目的增多,样本结构越接近总体。
抽样调查也就越接近全面调查。
当样本扩大到总体时,则为全面调查,也就不存在抽样误差了
②总体被研究标志的变异程度。
在其他条件不变的情况下,总体标志的变异程度越小,抽样误差越小。
总体标志的变异程度越大,抽样误差越大。
抽样误差和总体标志的变异程度成正比变化。
这是因为总体的变异程度小,表示吝惜体各单位标志值之间的差异小。
则样本指标与总体指标之间的差异也可能小;
如果总体各单位标志值相等,则标志变动度为零,样本指标等于总体指标,此时不存在抽样误差。
③抽样方法的选择。
重复抽样和不重复抽样的抽样误差的大小不同。
采用不重复抽样比采用重复抽样的抽样误差小。
④抽样组织方式不同。
采用不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对于总体的代表性也不同。
通常,我们不常利用不同的抽样误差,做出判断各种抽样组织方式的比较标准。
4.
5.离散系数?
方差和标准差是反映数据离散程度的绝对值,其数值大小一方面受平均数大小的影响,变量值绝对水平高的,离散程度的测度自然也就大;
另一方面,他们与原变量值的计量单位相同,所用不同计量单位计量的变量值,其离散程度的测度值也就不同。
对于平均水平不同和计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的离散系数,又称变异系数,是一组数据标准差与其平均数的比值消除了变量值水平高低和计量单位不同对离散程度测量的影响离散系数越大,说明数据的离散程度越大。
举例:
男生平均身高175cm,标准差10cm;
女生平均身高165cm,标准差3cm。
由于男生女生身高的平均数不同,无法直接比较其标准差,所以可以采用离散系数,消除了平均数不同的影响,反映其数据离散程度大小。
通过计算,男生身高离散系数为0.057,女生身高离散系数为0.018,男生生身高离散系数高于女生,所以男生身高离散程度较大。
6.统计上的大样本和小样本?
统计上的大样本和小样本并不是以样本量大小来区分的。
在样本量固定的条件下进行的统计推断、问题分析,不管样本量有多大,都称为小样本问题。
而样本量n趋近无穷的样本条件下进行的统计推断、问题分析则称为大样本问题。
一般而言统计学中n>
30,即为大样本,n<
30,为小样本,这只是一种经验说法。
样本量不同,统计计算方法也不同。
假设检验,区间估计的值也会不同。
一般来说,大样本情况下,根据中心极限定理,可以认为样本统计量的分布服从或接近于正态分布,可以利用正态分布的性质去推断全及总体的参数。
小样本情况下,样本统计量的分布常常与正态分布有所不同.必须利用其他分布的特征推断总体的参数。
7.何为置信区间?
区间估计是在点估计的基础上,给出总体参数的一个区间范围,该区间通常由样本统计量加减估计误差得到的。
在区间估计中,由样本统计量构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。
由于统计学家在某个程度上确信这个区间包含真正的总体参数,所以给它取名置信区间.一般而言,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的的次数所占的比例称为置信水平,也称置信度或置信系数。
当样本给定时,置信区间的宽度随着置信系数的增大而增大。
当区间比较宽时,才会使这一区间以更大的可能包含参数的真值。
当置信水平固定时,置信区间的宽度随着样本量的增大而减小。
如果用某种方法构造的区间中有95%的区间包含总体参数的真值,那么该方法构造的区间称为置信水平为95%的置信区间。
总体参数的真值是固定的、未知的,而样本构造的区间则是不固定的。
置信区间是一个随机区间,它会因样本的不同而不同,而不是所有的区间都包含总体参数的真值。
在实际问题中,进行估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平下的置信区间,而不再是随机区间,所以无法知道这个样本所产生的区间是否包含总体参数的真值。
一个特定的区间”总是包含”或“绝对不包含“参数的真值,不存在”以多大的概率包含参数“的问题。
8.一个完整的调查方案应该具备哪些要素?
一、调查目的和任务.统计调查总是为一定的研究任务服务的,制定调查方案的首要问题是明确调查的目的和任务。
二、调查对象和调查单位。
确定调查对象和调查单位,是为了回答向谁调查、由谁来具体地提供统计资料的问题。
三、调查项目,设计调查表式。
调查项目就是调查中所要登记的调查单位的特征,这些特征统计上又称标志。
确定调查项目所要解决的问题是:
向调查单位调查什么。
将反映调查单位特征的调查项目,按一定的顺序排列在一定的表格上,就构成了调查表。
四、调查的时间、空间和方法。
调查时间包括三个方面的含义:
首先是指调查资料所属的时间,如果所调查的是时期现象,就要明确规定反映的调查对象从何年何月何日起到何年何月何日止的资料;
如果所要调查的是时点现象,就要明确规定统一的标准时点。
其次是指调查工作进行的时间,即指对调查单位的标志进行登记的时间。
最后是指调查期限,即整个调查工作的时限,包括搜集资料及报送资料的整个工作所需要的时间。
调查空间是指确定调查单位在什么地方接受调查。
调查方法,包括调查的组织形式和搜集资料的具体方法。
五、制订调查工作的组织实施计划。
为了保证整个统计调查工作顺利进行,在调查方案中还应该有一个周密考虑的组织实施计划。
其主要内容应包括:
调查工作的领导机构和办事机构;
调查人员的组织;
调查资料报送办法;
调查前的准备工作,包括宣传教育、干部培训、调查文件的准备、调查经费的预算和开支办法、调查方案的传达布置、试点及其他工作等。
一份好的调查问卷可以有效的减少调查误差。
问卷中题目的类型、提问的方式、使用的词汇、问题的组合都可能引起非抽样误差。
9.同度量因素的主要作用?
同度量因素也成“同度量系数”或“指数权数”,是指使若干由于度量单位不同不能直接相加的指标,过渡到可以加总和比较而使用的媒介因素。
在编制总指数时,把不能直接相加的要素过渡到能够相加的总体的媒介因素。
同度量因素在计算总指数的过程中对各指数因素起着权衡轻重的作用,所以也叫权数。
同度量因素的作用主要有:
同度量作用(媒介作用)和权数作用。
不同商品的销售量和价格不能直接加总,他们都是不同度量的因素,然而每种商品销售额可以加总,因为它是同一度量的。
同度量因素可分为不变同度量因素和可变同度量因素。
不变同度量因素,是指在一个指数数列中各个指数的同度量因素是固定不变的。
可变同度量因素,是指在一个指数数列中各个指数的同度量因素随着指数基期的改变而改变。
在统计工作中,采用不变同度量因素还是可变同度量因素,对于质量指标指数和数量指标指数是不同的。
质量指标指数用报告期的数量指标做同度量因素,所以在一个质量指标指数的数列中,它的同度量因素一定是可变同度量因素;
而计算数量指标指数的数列中,定基指数的同度量因素是不变同度量因素,环比指数的同度量因素则是可变同度量因素。
单位产品价格×
产品产量=产品产值p×
q=pq单位产品成本×
产品产量=总成本z×
q=zq在以上方程式的右边,是经过同度量因素的作用,而可以相加或合并的总体。
10.抽样调查注意的问题?
抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。
显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。
根据抽选样本的方法,抽样调查可以分为概率抽样和非概率抽样两类。
概率抽样是按照概率论和数理统计的原理从调查研究的总体中,根据随机原则来抽选样本,并从数量上对总体的某些特征作出估计推断,对推断出可能出现的误差可以从概率意义上加以控制。
习惯上将概率抽样称为抽样调查。
抽样调查的步骤主要有;
(1)界定总体
(2)制定抽样框(3)实施抽样调查并推测总体(4)分割总体(5)决定样本规模(6)决定抽样方式(7)确定调查的信度和效度.抽样调查根据随机原则抽取样本,可以根据调查结果对总体的有关参数进行估计,计算估计误差,得到总体的置信区间,在进行抽样时,对估计的精度提出要求,计算为满足特定精度要求所需的样本量,所以,调查的目的在于掌握研究对象总体的数量特征,得到总体参数的置信区间,就应当使用抽样调查。
抽样调查技术含量高,无论是抽取样本还是对调查数据进行分析,都要求有较高的统计学知识,调查成本也较高。
抽样误差是由抽样的随机性引起的样本结果与总体真值之间的误差。
在抽样调查中,抽样误差是不可避免的。
抽样误差是可以计算的。
对抽样误差进行控制得一个方法就是改变样本量,要求抽样误差越小,样本量越大。
抽样调查需要注意哪些问题?
1)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。
(2)是以抽取的全部样本单位作为一个“代表团”,用整个“代表团”来代表总体。
而不是用随意挑选的个别单位代表总体。
(3)所抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。
(4)抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高。
方差分析主要解决什么问题:
1,使用方差分析的必要性:
随着个体显著性检验的次数增加,如比较多个总体的均值是否相等,若是用一般的检验方法,则需做多个均值的两两比较,作多次检验会使犯第Ⅰ类错误的概率增加,置信水平降低,而且
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 主观题 答案