北师《心理统计学》期末在线考试指导80Word文档格式.docx
- 文档编号:13233517
- 上传时间:2022-10-08
- 格式:DOCX
- 页数:29
- 大小:136.52KB
北师《心理统计学》期末在线考试指导80Word文档格式.docx
《北师《心理统计学》期末在线考试指导80Word文档格式.docx》由会员分享,可在线阅读,更多相关《北师《心理统计学》期末在线考试指导80Word文档格式.docx(29页珍藏版)》请在冰豆网上搜索。
2、次数多边形图的横坐标代表各组数据的组中值
3、对数据进行分组时,一定要按各组的精确下限和精确上限(左闭右开),例如这个数的上限是
4、若描述统计事项随时间的变化其总体指标的变化趋势,应该使用动态曲线图
5、按照测量的水平,数据的种类和特点
按照测量的水平,可以划分为称名变量、等级变量、等距变量和比率变量。
(1)称名变量,是指根据事物的某一特征,用来划分、区别事物的不同种类所形成的变量。
这类数据并无数量和序列的含义,不能进行数量化分析,不能做加减乘除的运算。
(2)等级变量,在对事物进行分类过程中,依据事物某种属性程度的大小排列顺序形成的变量。
等级变量既无相等单位,也无绝对零,不同组的等级变量间不能进行加减乘除的运算。
(3)等距变量,是指在观测标识事物某一特定属性时,具有相对参照点、有相等单位的变量。
可以进行加减运算,但是由于等距变量的参照点是相对的,即无绝对零点,因此不能进行乘除的运算。
(4)比率变量,是指既有相等单位又有绝对零参照点的变量,如身高、体重、反应时、各种感觉阈值的物理量等。
这类变量可以进行加减乘除的运算。
6、根据数据的分布形式,可以将数据分为离散变量和连续变量
连续变量的单位是无限的,可以细微到只可想象而不能看见的程度。
例如,研究者想要研究概念形成能力随着年龄的发展特点,在其研究中,研究者记录了每个测查者的年龄,则在此研究中年龄是连续变量。
离散变量的数字形式一般是整数,两个单位之间不能再划分细小单位。
(三)集中量数
集中量数主要用来描述一组数据的集中趋势,常用的代表性的集中量数有算术平均数、中数、众数。
1、算术平均数:
又称平均数,是集中量数中性能最好的一个统计量,一般用M表示。
算术平均数反应灵敏,计算简单;
但易受极端数据的影响。
平均数的计算公式为:
加权平均数:
指一组数据中每个数据与其权重乘积的总和除以权重总和所得的商。
几何平均数应用时机:
求一组等比或近似等比数据的平均数时;
一组数据中有少数偏大或偏小的数据,数据分布呈偏态时;
教育上,关于平均发展速度或者是对某项目标进行预估。
2、中数与众数
中数:
又称中点数,中位数,中值。
符号为Md或Mdn。
中数是按一定顺序排列在一起的一组数据中居于中间位置的数。
例如,数列11,11,12,12,13,13,13,17,17,18对应的中数是。
在一般情况下,中数不被普遍应用。
但在以下特殊情况下,它的应用受到重视:
当一组数据有极端值出现时;
当一组有序数据两端有个别数据模糊不清或分组资料有不确定组限时;
当需要快速估计一组数据的代表值时。
众数:
又称为密集数、范数等,常用符号M0表示,众数是指在次数分布中出现次数最多的那个数的数值。
3、平均数、中数与众数三者之间的关系
在正态分布中三者相等,在正偏态分布中,平均数大于中数,中数大于众数。
在负偏态分布中,平均数小于中数,中数小于众数。
M<
Md<
Mo。
对于数据较多的资料,其算术平均数与中位数的值不会相差太大。
(四)差异量数
差异量数是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。
差异量数分为:
绝对差异量数和相对差异量数;
绝对差异量数:
标准差,方差,四分差
相对差异量数:
差异系数
1、全距、百分位差和四分差
(1)全距又称两极差,用符号R表示,用最大值减去最小值就是全距。
(2)如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。
例如,P55=65,则表示低于65分的人数占总人数的55%。
百分位差是用百分位数之间的差值来表示离中趋势的一种差异量数。
(3)四分差,又称为四分位差,四分位差也可视为百分位差的一种,通常用符号Q来表示,指在一个次数分配中,中间50%的次数的全距的一半。
例如,已知在甲分布中P90-P10=38,在乙分布中P90-P10=24,两个分布的分散程度,则甲>
乙。
2、标准差、方差
(1)方差:
也称变异数,均方。
作为样本统计量,用符号s2表示,作为总体参数,用σ2表示。
它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。
方差差的计算公式为
标准差是一组同质数据间变异度大小的量度指标,但是如果两组数据平均数相差较大时,不能采用标准差进行比较。
标准差、方差是描述数据的离散趋势最好的统计值。
(2)方差性质:
可加性、可分解性
标准差特性:
每一个观察值都加一个相同常数C之后,计算得到的标准差等于原标准差。
每一个观察值都乘一个相同常数C,则所得到的标准差等于原标准差乘以常数C。
以上两点结合,每一个观察值都乘以一个常数C(C不等于0),再加上一个常数d,所得标准差等于原标准差乘以常数C。
(3)方差、标准差的意义:
是表示一组数据离散程度的最好指标。
其值越大,表示数据的离散程度越大,该组数据越分散;
其值越小,表示次数分布的数据比较集中,数据的离散程度越小。
3、差异系数:
又称变异系数、相对标准差等,是一种相对差异量,用CV表示,为标准差对平均数的百分比,计算公式:
CV=S/M×
100%。
差异系数的心理与教育研究中常用于:
(1)同一团体不同观测值离散程度的比较,如身高和体重离散程度的比较;
(2)对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。
4、标准分数:
(1)又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
标准分数的计算公式:
例如,将一个均值为38,标准差为4的正态分布通过线性变换转换为均值为100,标准差为10的正态分布,则原始分数40在转换后的分布中对应的标准分数为。
(2)标准分数在实际中的应用:
①用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低;
②计算不同值的观测值的总和或平均值,以表示在团体中的相对位置;
例如,某班语文平均成绩为70,标准差为8,数学平均成绩为55,标准差为4,A考生语文成绩为70分,数学成绩为57分,B考生语文成绩为57分,数学为70分,考察A和B谁的成绩更好,则需要根据公式首先计算A考生语文、数学的z分数,以及B考生语文和数学的z分数,然后根据z分数比较A和B谁的成绩更好,计算可知B考生的成绩更好。
③表示标准测验分数。
(五)相关系数
1、相关系数用于描述双变量数据相互之间的关系,是两列变量间相关程度的数字表示形式,或者说是用来表示相关强度的指标。
样本相关系数用r表示,总体一般用
表示。
相关系数的取值介于至+之间,常用小数形式表示。
相关系数的正负号,表示相关方向,取值的大小表示相关的程度。
如果两个相关系数取值相同,正负号不同,则相关程度相同。
当XY相关程度很小时,从X推测Y的可靠性就很小。
2、散点图
(1)散点图是用相同大小圆点的多少或疏密表示统计资料数量大小及变化趋势的图。
通常以圆点分布的形态表示两种现象间相关程度。
(2)在实际中的用途:
在相关研究中,通常用散点图表示两个变量之间的关系。
通过点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度,能够对原始数据间的关系做出直观而有效的预测和解释。
因此,散点图是确定变量之间是否存在相关关系及关系紧密程度的简单又直观的方法。
3、积差相关的适用条件:
(1)两列数据都是测量的数据,而且两列变量各自总体的分布都是正态的,即正态双变量。
(2)两列变量之间的关系应是直线性的,非直线性的双列变量,不能计算线性相关。
(3)两变量测量到的数据必须是成对的数据,对于不成对的数据无法计算相关,即使计算,得到的相关也没有意义。
计算公式:
,
,N为成对数据的数目,
为X变量的标准差,Sy为Y变量的标准差。
利用原始数据计算,公式可以转化为:
其计算步骤为:
(1)计算
变量的
、
和
;
(2)计算
(3)计算
(4)将有关数据代入公式,求得
。
例如,计算12名学生两项心理测验的得分的相关系数,可以利用积差相关。
4、等级相关
(1)斯皮尔曼等级相关:
①两变量的资料为等级测量数据,且具有线性关系;
②连续变量的测量数据,按其大小排成等级,也可以用等级相关法计算;
③不要求总体呈正态分布。
例如,想了解某一测验结果(测验结果服从正态分布)与文化程度是否有关联,可以采用等级相关。
(2)肯德尔等级相关的适用条件:
两列以上的,等级变量之间的相关关系,一般常用来表示评分者信度。
5、点二列相关
两列变量一列是正态连续性变量,另一列是二分变量,描述这两个变量之间的相关,称为点二列相关。
例如,某测验测试总分为连续变量,且服从正态分布,为了描述某一选择题的区分度,应采用点二列相关。
6、质量相关的适用条件:
处理的变量中有类别数据。
7、相关系数的选择:
主要取决于要处理数据的性质类别以及某一相关系数需要满足的假设条件。
(六)概率分布
1、概率
(1)通俗地说,概率就是描述随机事件发生可能性大小的数。
(2)概率的性质
任何一个随机事件A的概率都是非负的。
必然事件的概率为1,必然事件是指在一定条件下必然发生的事件。
不可能事件的概率为0,不可能事件是指在一定条件下必然不发生的事件。
在统计推断中小概率事件一般被称为不可能发生的事件。
2、二项分布
二项分布是指试验仅有两种不同性质结果的概率分布。
二项分布的具体定义为:
假设有n次试验,各次试验是彼此独立的,每次试验某事件出现的概率都是p,某事件不出现的概率都是q(等于1-p),则对于某事件出现X次(0,1,2,3…,n)的概率分布为:
b()=
例如,两道四选一的选择题,一考生全凭猜测,猜对一道题的概率是
二项分布的特点:
(1)二项分布是离散型分布,概率直方图是跃阶式。
(2)当p=q时,图形是对称的。
(3)当p不等于q时,图形呈偏态。
(4)如果二项分布满足p<
q,np>
5(或p>
q,nq>
5)时,二项分布接近正态分布,此时具有如下性质:
例如,有10道正误题,问答题者答对几道题才能认为他是真会,或则说对几题,才能认为不是出于猜测因素?
解:
已知猜对与猜错的概率p=q=1/2时,np=5,此二项分布接近正态分布,故:
根据正态分布概率,当Z=时,该点以下包含了全体的95%。
如果用原始分数表示,则为
它的意义是完全凭猜测,10道题猜中8道题以下的可能性为95%,猜对8,9,10道题的概率只有5%。
因此可以推论说,答对8道题以上者不是凭猜测,表明答题者真的会答。
3、正态分布
(1)正态分布又叫常态分布,是连续随机变量概率分布的一种。
一个标准正态分布的平均数为0
正态分布曲线函数又称密度函数,一般方程为:
其中,
是圆周率...
e是自然对数的底...;
X为随机变量取值
为理论平均数,
为理论方差;
y为概率密度,即正态分布的纵坐标。
(2)正态分布的特点
①正态分布的形式是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理统计学 北师 心理 统计学 期末 在线 考试 指导 80