统计学课后思考Word格式.docx
- 文档编号:16146738
- 上传时间:2022-11-20
- 格式:DOCX
- 页数:15
- 大小:26.80KB
统计学课后思考Word格式.docx
《统计学课后思考Word格式.docx》由会员分享,可在线阅读,更多相关《统计学课后思考Word格式.docx(15页珍藏版)》请在冰豆网上搜索。
按被描述的现象与实践的关系分;
截面数据:
在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:
按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据
答案同1.3
1.5举例说明总体,样本,参数,统计量,变量这几个概念
对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类
变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量
离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
2.1什么是二手资料?
使用二手资料应注意什么问题
与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”。
使用时要进行评估,要考虑到资料的原始收集人,收集目的,收集途径,收集时间使用时要
注明数据来源。
2.2比较概率抽样和非概率抽样的特点,指出各自适用情况
概率抽样:
抽样时按一定的概率以随机原则抽取样本。
每个单位别抽中的概率已知或可以计
算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽到的概率。
技术含量和
成本都比较高。
如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区
间,就使用概率抽样。
非概率抽样:
操作简单,时效快,成本低,而且对于抽样中的统计学专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
它同样使用
市场调查中的概念测试(不需要调查结果投影到总体的情况)。
2.6如何控制调查中的回答误差
对于理解误差,我会去学习一定的心理学知识,对于记忆误差,我会尽量去缩短所涉及的时间范围,对于有意识的误差,我要做好被调查者的心理工作,要遵守职业道德,为被调查者
保密,尽量在问卷中不涉及敏感问题。
2.7怎么减少无误差
对于随机误差,要提高样本容量,对于系统误差,只有做好准备工作并做好补救措施。
比如
说要一百份的问卷回复,就要做好一百二十到一百三十的问卷准备,进行面访式的时候要尽
量的劝服不愿意回答的被访者,以小物品的馈赠提高回复率。
3.1数据预处理内容
数据审核(完整性和准确性;
适用性和实效性),数据筛选和数据排序。
3.2分类数据和顺序数据的整理和图示方法各有哪些
分类数据:
制作频数分布表,用比例,百分比,比率等进行描述性分析。
可用条形图,帕累托图和饼图进行图示分析。
顺序数据:
制作频数分布表,用比例,百分比,比率。
累计频数和累计频率等进行描述性分析。
可用条形图,帕累托图和饼图,累计频数分布图和环形图进行图示分析。
3.3数据型数据的分组方法和步骤
分组方法:
单变量值分组和组距分组,组距分组又分为等距分组和异距分组。
分组步骤:
1确定组数2确定各组组距3根据分组整理成频数分布表
3.4直方图和条形图的区别
1条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组频数,
矩形的高度表示每一组的频数或频率,宽度表示组距,2直方图各矩形连续排列,条形图分
开排列,3条形图主要展示分类数据,直方图主要展示数值型数据。
3.5绘制线图应注意问题
时间在横轴,观测值绘在纵轴。
一般是长宽比例10:
7的长方形,纵轴下端一般从0开始,
数据与0距离过大的话用折断符号折断。
3.6饼图和环形图的不同
饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总体的数据
系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。
3.7茎叶图比直方图的优势,他们各自的应用场合
茎叶图既能给出数据的分布情况,又能给出每一个原始数据,即保留了原始数据的信息。
在
应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。
3.8鉴别图标优劣的准则
P75明确有答案,我就不写了。
3.9制作统计表应注意的问题
1,合理安排统计表结构2表头一般包括表号,总标题和表中数据的单位等内容3表中的上
下两条横线一般用粗线,中间的其他用细线4在使用统计表时,必要时可在下方加注释,注明数据来源。
公式:
组中值=(上限+下限)/2
4.1一组数据的分布特征可以从哪几个方面进行测度?
数据分布特征可以从三个方面进行测度和描述:
一是分布的集中趋势,反映各数据向其中心
值靠拢或集中的程度;
二是分布的离散程度,反映各数据远离其中心值的趋势;
三是分布的形状,反映数据分布的偏态和峰态。
4.2怎样理解平均数在统计学中的地位?
平均数在统计学中具有重要的地位,是集中趋势的最主要的测度,主要适用于数值型数
据,而不适用于分类数据和顺序数据。
4.3简述四分位数的计算方法。
四分位数是一组数据排序后处于25%和75%位置上的值。
根据未分组数据计算四分位数时,首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就是四分位数。
4.4对于比率数据的平均为什么采用几何平均?
在实际应用中,对于比率数据的平均采用几何平均要比算数平均更合理。
从公式
n
(1G)n(1GJ中也可看出,g就是平均增长率。
i1
4.5简述众数、中位数和平均数的特点和应用场合。
众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。
众数只有在数据量较多时才有意义,数据量较少时不宜使用。
主要适合作为分类数据的集中趋势测度值。
中位数是一组数据中间位置上的代表值,不受极端值的影响。
当数据的分布偏斜较大时,使
用中位数也许不错。
主要适合作为顺序数据的集中趋势测度值。
平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。
当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。
但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。
4.6简述异众比率、四分位差、方差或标准差的适用场合
对于分类数据,主要用异众比率来测量其离散程度;
对于顺序数据,虽然也可以计算异众比率,但主要使用四分位差来测量其离散程度;
对于数值型数据,虽然可以计算异众比率和四分位差,但主要使用方差或标准差来测量其离散程度。
4.7标准分数有哪些用途?
标准分数给出了一组数据中各数值的相对位置。
在对多个具有不同量纲的变量进行处理
时,常需要对各变量进行标准化处理。
它还可以用来判断一组数据是否有离群数据。
4.8为什么要计算离散系数?
方差和标准差是反映数据分散程度的绝对值,一方面其数值大小受原变量值本身水平高
低的影响,也就是与变量的平均数大小有关;
另一方面,它们与原变量的计量单位相同,采
用不同计量单位的变量值,其离散程度的测度值也就不同。
因此,为消除变量值水平高低和
计量单位不同对离散程度测度值的影响,需要计算离散系数。
4.9测度数据分布形状的统计量有哪些?
对分布形状的测度有偏态和峰态,测度偏态的统计量是偏态系数,测度峰态的统计量是峰态
系数。
6.1什么是统计量?
为什么要引进统计量?
统计量中为什么不含任何未知参数?
统计量:
X1,X2…,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T
(X1,X2…,Xn),不依赖于任何未知参数,则称函数T(X1,X2…,Xn)是一个统计量。
原因:
为了使统计推断成为可能。
6.2判断下列样本函数中哪些是统计量T1和T2是
6.3次序统计量:
设简单随机样本(X1,X2,--Xn)来自总体,从小到大排序为x(d,x
(2),…溯,则称X
(1),X
(2),…,X),为次序统计量。
6.4充分统计量:
统计量加工过程中一点信息都不损失的统计量为充分统计量
6.5自由度:
独立变量的个数
6.6简述2分布、t分布、F分布及正态分布之间的关系:
设
X~N(,2)ZN(0’1)
Uni
F分布:
设若U为服从自由度为ni的2分布,即U~2(m),v为服从自由度为n2的2分布,即V~2(n2),且U和V相互独立,贝U
FV匕
称F为服从自由度ni和n2的F分布,记为
6.7抽样分布:
样本统计量的概率分布是一种理论概率分布随机变量是样本统计量
6.8中心极限定理的意义:
设从均值为,方差为2的一个任意总体中抽取容量为n的样
本,当n充分大时,样本均值的抽样分布近似服从均值为卩、方差为不/n的正态分布。
中心
极限定理是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从正态分布
的条件。
7.1估计量:
用于估计总体参数的随机变量
估计值:
估计参数时计算出来的统计量的具体值
7.2评价估计量好坏的标准:
无偏性:
估计量抽样分布的数学期望等于被估计的总体参数
有效性:
对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效
一致性:
随着样本容量的增大,估计量的值越来越接近被估计的总体参数
7.3置信区间:
由样本统计量所构造的总体参数的估计区间
7.4解释95%的置信区间:
95%的置信区间指用某种方法构造的所有区间中有95%的区间
包含总体参数的真值。
7.5含义:
Za/2是标准正态分布上侧面积为a/2的z值,公式是统计总体均值时的边际误差。
7.6独立样本:
如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样
本中的元素相互独立。
匹配样本:
一个样本中的数据与另一个样本中的数据相对应。
7.7在对两个总体均值之差的小样本估计中,对两个总体和样本都有哪些假定?
(1)、两个总体都服从正态分布
(2)、两个随即样本独立地分别抽自两个总体
7.8简述样本量与置信水平、总体方差、估计误差的关系。
样本量越大置信水平越高,总体
方差和边际误差越小
8.1假设检验和参数估计有什么相同点和不同点?
答:
参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推
断,然而推断的角度不同。
参数估计讨论的是用样本统计量估计总体参数的方法,总体参数
卩在估计前是未知的。
而在参数假设检验中,则是先对卩的值提出一个假设,然后利用样本
信息去检验这个假设是否成立。
8.2什么是假设检验中的显著性水平?
统计显著是什么意思?
显著性水平是一个统计专有名词,在假设检验中,它的含义是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 课后 思考
![提示](https://static.bdocx.com/images/bang_tan.gif)