统计学重点.docx
- 文档编号:26778779
- 上传时间:2023-06-22
- 格式:DOCX
- 页数:12
- 大小:108.96KB
统计学重点.docx
《统计学重点.docx》由会员分享,可在线阅读,更多相关《统计学重点.docx(12页珍藏版)》请在冰豆网上搜索。
统计学重点
统计学复习重点
一.名词解释
1)英汉翻译(名词含义要掌握)
众数(mode)中位数(median)四分位(quartile)均值(mean)峰态(kurtosis)
偏态(skewness)几何平均(geometricmean)统计学(sartistics)截面数据(cross-sectionaldata)
时间数据(timesseriesdata)总体(population)样本(sample)分类变量(rankvariable)
頻数(frequency)列联表(contingencytable)饼图(piechart)茎叶图(stem-and-leaf-piot)
直方图(histogram)移动平均法(movingaverage)指数平滑法(exponentialsmoothing)
回归模型(regressionmodel)拟合优度(goodnessoffit)线性趋势(lineartrend)自相关(autocorrtion)
偏自相关(partialautocorrtion)
2)名词解释(名词的科学定义)
四分位差:
也称内距或四分间距,它是上四分位数和下四分位数之差(83)
四分位数:
也称四分位点,它是一组数据排序后处于25%和75%位置上的值(77)
众数:
一组数据中出现次数最多的变量值
茎叶图:
由“茎”和“叶”两部分构成,其图形是由数字组成的,以该组数据的高位数值作树茎,低位数字作树叶,树叶上只保留最后一位数字
移动平均法:
通过对时间序列逐期递移求得平均数作为趋势值或预测值的一种预测方法(336)
相关系数:
是根据样本数据计算的度量两个变量之间线性关系强度的统计量,记为r。
(270)
指数平滑法:
是通过对过去的观察值加权平均进行预测的一种方法(337)
季节指数:
刻画了序列在一个年度内各月或各季度的典型季节特征(351)
假设检验:
利用样本信息,对提出的命题进行检验的一套程序和方法
多重共线性:
当回归模型中两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性(308)
最小二乘法:
276
均方误差:
标准误差定义为各测量值误差的平方和的平均值的平方根,故又称为均方误差(?
)
自相关系数:
自相关(autocorrelation)是时间序列各观测值之间的相关
白噪声序列:
对于一个纯随机过程来说,若其期望和方差均为常数,则称之为白噪声过程。
白噪声过程的样本实称成为白噪声序列,简称白噪声(?
)
AR模型:
自回归(autoregression)模型,简称AR模型,是利用观测值Yt与以前时期的观测值之间的关系来预测值Y的一种多元回归方法
MA模型:
移动平均(movingaverage)模型,简称MA模型,是利用观测值Yt作为因变量,预测Yt时产生的预测误差作为自变量
平稳序列:
指基本上不存在趋势的序列。
二.简答题
1)什么是统计学?
收集、处理、分析、解释数据并从数据中得出结论的科学,统计学是一门科学,是一种技术,是一门艺术
2)统计数据可分为哪几种类型,不同类型数据各有什么特点?
分类数据:
只能归于某一列别的非数字型数据,它是对事物进行分类的结果,数据变现为类别,是用文字来表述的
顺序数据:
只能归于某一有序类别的非数字型数据。
顺序数据虽然也是类别,但这些类别是有序的
数值型数据:
按数字尺度测量的观察值,其结果表现为具体的数值
3)总体、样本、参数、统计量、随机变量内容及关系?
4)一组数据的分布特征可以从哪几个方面进行测度
数据分布特征可以从三个方面进行测度和描述:
一是分布的集中趋势,反映各数据向其中心值靠拢或者集中的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态
5)鉴别图表优劣的准则有哪些?
一张好的图形应当:
1精心设计,有助于洞察问题的实质
2使复杂的观点得到简明、确切、高效的阐述
3能在最短的时间内,以最少的笔墨给读者提供最大量的信息
4是多维的
5表述数据的真实情况
6)Excel的数据透视表用途?
数据透视表是交互式报表,可快速合并和比较大量数据。
可旋转其行和列以看到数据源不同汇总,而且可显示感兴趣区域的明细数据
7)解释描述统计和推断统计
描述统计:
研究数据收集、整理和描述的统计学方法
推断统计:
研究如何利用样本数据来推断总体特征的统计学方法
8)简述众数、中位数和平均数的特点及应用场合
众数是一组数据分布的峰值不受极端值的影响缺点是具有不唯一性。
众数只有在数据量较多时才有意义数据量较少时不宜使用。
主要适合作为分类数据的集中趋势测度值。
中位数是一组数据中间位置上的代表值不受极端值的影响。
当数据的分布偏斜较大时使用中位数也许不错。
主要适合作为顺序数据的集中趋势测度值。
平均数对数值型数据计算的而且利用了全部数据信息在实际应用中最广泛。
当数据呈对称分布或近似对称分布时三个代表值相等或相近此时应选择平均数。
但平均数易受极端值的影响对于偏态分布的数据平均数的代表性较差此时应考虑中位数或众数。
9)简述参数最小二乘估计的基本原理
使因变量的观察值与估计值之间的误差平方和达到最小来求得和的方法。
即
用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小
10)如何做回归分析显著性检验(F检验,t检验的用途)
t检验是对单个变量系数的显著性检验
F检验是对整个模型的拟合优度检验,即所有变量对被解释变量的显著性检验
11)假设检验中容易出现哪几类错误?
第Ⅰ类错误:
错误,原假设为正确时拒绝原假设
第Ⅱ类错误:
错误,原假设为错误时未拒绝原假设
12)多元回归显著性检验方差分析表的原假设是什么
13)简述时间序列的构成要素
时间序列可以分为平稳序列与非平稳序列,非平稳序列包含有趋势性、季节性和周期性,因此可将时间序列变化分解为长期趋势,季节变动,周期变动和不规则变动四个因素。
长期趋势反映了现象在较长时间内的发展方向,持续向上或向下的态势;季节变动表现为以一年为周期的规则变动;周期变动是围绕长期趋势的一种起伏波动;不规则变动则是随机性,偶然性变动
14)自相关与偏自相关系数用来测度什么
自相关系数用来测度时间序列各观测值之间的相关程度;偏自相关系数用来测度其他滞后变量不变时,Yt与Yt-k相关程度
15)如何正确选择AR模型与MA模型?
自回归(autoregression)模型,简称AR模型,是利用观测值Yt与以前时期的观测值之间的关系来预测值Y的一种多元回归方法。
AR模型意味着时间序列的任意一个观测值都是由以前的p个观测值的线性组合加上随机误差et
通常的办法是观察时间序列的自相关图和偏自相关图
AR序列的自相关图和偏自相关图具有的典型特征:
自相关图单调递减逐步降为0或交替递减逐步降为0,而它的偏自相关图则具有明显的峰值
移动平均(movingaverage)模型,简称MA模型,是利用观测值Yt作为因变量,预测Yt时产生的预测误差作为自变量。
MA模型意为着时间序列的任意一个观测值都是由目前的和以前的q个随机误差的线性组合
通常的办法仍然是观察时间序列的自相关图和偏自相关图
自相关图则具有明显的峰值,而它的偏自相关图单调递减逐步降为0或交替递减逐步降为0,
三.计算题类型
1)第一大题名词中涉及计算方面
2)列联表计算
3)完成方差分析表
4)绘制条形图、怕累托图、饼图、蜘蛛图
5)移动平均,简单指数平滑计算
6)对本学期学过的统计内容由计算机计算后输出结果做分析
计算题:
众数、中位数、四分位数、方差、平均值,标准差、极差、相关系数(分出考两题计算题
)10*2、
2分类数据第六章的分类变量10分
3、SPSS软件参数的最小二乘估计15分
1、求众数、中位数、四分位数、方差、平均值,标准差、极差、相关系数
10人5月销售的的汽车数为
245894612146
众数:
中位数:
四分位:
法一:
(根据定义法):
平均数:
极差:
方差:
标注差:
2、列联表计算
一家电脑配件供应商声称,他所提供的配件100个中拥有次品的个数及概率如下表。
求该供应商次品数的数学期望和标准差
次品数X=x1,x2...
0
1
2
3
P(X=x1,...)
0.75
0.12
0.08
0.05
3移动平均,简单指数平滑计算
下表数据是某商品15个月的销售额(单位:
万元)
(1)用5期移动平均法预测第16周的销售额
(2)才要指数平滑法,用平滑系数a=0.3预测第16周的销售额。
4、绘制条形图、怕累托图、饼图、蜘蛛图(
(1)绘制条形图、怕累托图、饼图、蜘蛛图
5、对本学期学过的统计内容由计算机计算后输出结果做分析(看着办,不会的话,尽量多写点)
6)完成方差分析表()
补:
某信息咨询公司受委托调查了解顾客对甲、乙、丙三种品牌矿泉水的喜好程度,随机观察了150名购买者的购买情况,并作如下统计。
(看看就好)
问顾客对这三种品牌矿泉水的喜好是否存有差异?
解本题是一维三项概率分布。
令p1、p2、p3分别表示顾客喜好甲、乙、丙品牌的比例,若顾客对这三种品牌矿泉水的喜好没有差异,则意味着顾客中喜好每种品牌的概率均为1/3,因此,可作假设
(计算题一般逃不出这几道题了,,计算过程自己去算一遍,就不写出来了,会更有效果)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 重点