心理统计与测量.docx
- 文档编号:24772819
- 上传时间:2023-06-01
- 格式:DOCX
- 页数:88
- 大小:76.09KB
心理统计与测量.docx
《心理统计与测量.docx》由会员分享,可在线阅读,更多相关《心理统计与测量.docx(88页珍藏版)》请在冰豆网上搜索。
心理统计与测量
心理统计与测量
第一章描述统计
第一节统计图表
一、统计图
(一)统计图的结构及其绘制规则
统计图由标题、图号、标目、图形、图注等项构成。
下面按其构成部分说明绘图的基本规则。
标题 图的名称应简明扼要,切合图的内容,必要时可注明时间、地点。
图号 文章中若有几幅画,则需按其出现的先后次序编上序号,写在图题的作前方。
标目 对于有纵横轴的统计图,应在纵横轴上分别标明统计项目及其尺度。
图形 图形线在图中为最粗,而且要清晰。
图注 图注不是图中必要组成部分。
(二)表示间断变量的统计图
1、直条图
直条图是用直条的长短表示统计事项数量的图形。
它主要是用来比较性质相似的间断性资料。
2、圆形图
圆形图是用来表示间断性资料构成比的图形。
(三)表示连续变量的统计图
1、线形图
线形图用来表示连续性资料。
它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。
2、频数分布图
常用的频数分布图有直方图、多边图和累积多边图。
(1)直方图
直方图用面积表示频数分布。
用各组上下限上的矩形面积表示各组频数。
(2)多边图
多边图以纵轴上的高度表示频数的多少。
(3)累积频数和累积百分比多边图
二、统计表
(一)统计表的结构及其编制的原则和要求。
统计表一般由标题、表号、标目、线条、数字、表注等项构成。
标题 标题是表的名称,应确切地、简明扼要地说明表的内容。
表号 表号是表的序号。
标目 标目是表格中对统计数据分类的项目。
线条 线条不宜过多。
数字 表内数字必须准确,一律用阿拉伯数字表示,位次对齐,小数的位数一致。
表注 它不是表的必要组成部分。
(二)统计表的总类
1、简单表
只列出观察对象的名称、地点、时序或统计指标名称的统计表为简单表。
2、分组表
只按一个标志分组的统计表为分组表。
3、复合表
按两个或两个以上标志分组的统计表为复合表。
(三)频数分布表列法
1、简单频数分布表
(1)间断变量的频数分布表
(2)连续变量的频数分布表
步骤:
①求全距 ②决定组数和组距 ③决定组限决定组限 ④登记频数
2、累积频数和累积百分比分布表
(1)累积频数分布表
用累积频数表示的频数分布表称为累积频数分布表。
(2)累积百分比分布表
累积百分比分布表是累积频数分布表的变型。
它是用累积百分比表示的频数分布表。
第二节集中量数
一、算术平均数
(一)算术平均数的概念
算术平均数是所有观察值得总和除以总频数所得之商,简称为平均数或均数。
算术平均数的特征:
(1)观察值的总和等于算术平均数的N倍;
(2)各观察值与其算术平均数之差的总和等于零;
(3)若一组观察值是由两部分(或几部分)组成,这组观察值的算术平均数可以由组成部分算术平均数而求得;
(二)算术平均数的应用及其优缺点
算术平均数具备一个良好的集中量所应具备的一些条件:
(1)反应灵敏。
(2)严密确定。
简明易懂,计算方便。
(3)适合代数运算。
(4)受抽样变动的影响较小。
除此之外,算数平均数还有几个特殊的优点:
(1)只知一组观察值的总和及总频数就可以求出算术平均数。
(2)用加权法可以求出几个平均数的总平均数。
(3)用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值。
(4)在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。
算术平均数的缺点:
(1)易受两极端数值(极大或极小)的影响。
(2)一组数据中某个数值的大小不够确切时就无法计算其算术平均数。
二、中数
(一)中位数的概念
中位数是位于依一定顺序排列的一组数据中央位置的数值,在这一数值上、下各有一半频数分布着。
(二)中位数的计算方法
1、原始数值计算方法
将一组原始数据依大小顺序排列后,若总频数为奇数,就以位于中央的数据作为中位数;若总频数为偶数,则以最中间的两个数据的算术平均数作为中位数。
2、频数分布表计算法
若一组原始数据已经编成了频数分布表,可用内插法,通过频数分布表计算中位数。
(三)百分位数的概念及其计算方法
百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值。
在心理测量中,常通过计算百分位数来说明、解释和评价分数在团体中所处的位置。
计算公式为。
(四)中位数的应用及其优缺点
中位数虽然也具备一个良好的集中量所应具备的某些条件,例如比较严格确定、简明易懂,计算简便,受抽样变动影响较小,但是它不适合进一步的代数运算。
它适用于以下几种情况:
(1)一组数据中有特大或特小两极端数值时;
(2)一组数据中有个别数据不确切时;(3)资料属于等级性质时。
三、众数
(一)众数的概念
众数是集中量的一种指标。
对众数有理论众数及粗略众数两种定义方法。
理论众数是指与频数分布曲线最高点相对应的横坐标上的一点。
粗略众数是指一组数据中频数出现最多的那个数。
(二)众数的计算方法
1、用观察法直接寻找粗略众数
粗略众数不需要计算,可通过观察直接寻得。
2、用公式求理论众数的近似值
(1)皮尔逊(K.Person)的经验法
利用皮尔逊发现的算术平均数、中位数、众数三者关系来求理论众数近似值的经验公式为(3.6)。
(2)金氏(W.I.King)插补法
当频数分布呈偏态,即众数所在组以上各组频数总和与以下各组频数总和相差较多时,可以用金氏公式计算众数,以进行比率调整。
其公式为(3.7)。
(三)众数的应用及其优缺点
众数虽然简明易懂,但是它并不具备一个良好的集中量的基本条件。
它主要在以下情况下使用:
(1)当需要快速而粗略地找出一组数据的代表值时;
(2)当需要利用算术平均数、中位数和众数三者关系来粗略判断频数分布的形态时;(3)利用众数帮助分析解释一组频数分布是否确实具有两个频数最多的集中点时。
第三节差异量数
一、离差与平均差
(一)离差:
每一个数据与该组数据的算术平均数的差。
(二)平均差
1、平均差的概念
所谓平均差,就是每一个数据与该组数据的中位数(或算术平均数)离差的绝对值的算术平均数。
2、平均差的计算方法
用原始数据计算平均差的公式为(4.3)
3、平均差的优缺点
平均差意义明确,计算容易,每个数据都参加了运算,考虑到全部的离差,反应灵敏。
但计算要用绝对值,不适合代数运算。
二、方差与标准差
(一)方差和标准差的概念
方差是指离差平方的算术平均数。
其定义公式为(4.5),计算公式是(4.7)。
标准差是指离差平方和平均后的方根。
即方差的平方根。
其定义公式为(4.6),计算公式是(4.8)。
(二)方差和标准差的应用及其优缺点
方差和标准差的优点:
反应灵敏,随任何一个数据的变化而表示;一组数据的方差和标准差有确定的值;计算简单;适合代数计算,不仅求方差和标准差的过程中可以进行代数运算,而且可以将几个方差和标准差综合成一个总的方差和标准差;用样本数据推断总体差异量时,方差和标准差是最好的估计量。
三、变异系数
(一)所谓差异系数是指标准差与其算术平均数的百分比。
它是没有单位的相对数。
其计算公式是(4.11)
(二)差异系数的用途
1、比较不同单位资料的差异程度
2、比较单位相同而平均数相差数较大的两组资料的差异量程度
3、可判断特殊差异情况
(三)差异系数的应用条件
从测验的理论来说,只有等比量表才使平均数等于零成为不可能。
也就是说,用来测量的量尺,既具有等距的单位,又具有绝对零点,这时所测量出的数据其平均数才不可能等于零,这时才能计算差异系数。
第四节相对量数
一、百分位数
公式:
二、百分等级
公式:
三、标准分数
(一)公式
(二)性质
1、Z分数无实际单位,以平均数为参照点,以标准差为单位的一个相对量
2、一组原始分数转换得到的Z分数可以是正,也可是负。
3、在一组数据中,各个Z分数的标准差是1。
4、若原始分数呈正态分布,则转换得到的所有Z分数数值的均值为0,标准差为1的正态分布。
(三)优点
1、可比性
2、可加性
3、明确性
4、稳定性
(四)应用
1、用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。
2、计算不同质的观测植的总和或平均值,以表示在团体中的相对位置。
3、表示标准测验分数
五、相关量数
1、积差相关
适用资料:
两列变量为正态等距,呈线性关系
公式:
2、等级相关
适用于等级变量的资料
(1)斯皮尔曼相关
适用于两列变量均为等级变量的呈线性相关的资料
公式:
D为各对偶等级差
(2)肯德尔和谐系数
适用于K个评价者,评价多个事物的等级变量资料,多用于评分者信度分析。
公式:
有相同等级
3、点二列相关
适用于一列为等距正态变量的测量数据,另一列为名义变量数据。
常应用于试卷的信度分析。
公式:
其中是两个二分变量对偶的连续变量的平均数,
p、q是二分变量各自所占的比率,p+q=1,St是连续变量的标准差
4、二列相关
适用于两列变量均为正态等距变量,但一列被人为的分为两类。
其中ST与是连续变量的标准差与平均数,y为P的正态曲线的高度
5、φ相关
当两个相关关联着的变量分布都是真正的二分变量,列联表系数。
公式:
第二章推断统计
第一节推断统计的数学基础
一、概率
(一)概率的定义
概率因寻求的方法不同有两种定义,即后验概率和先验概率。
1、后验概率的定义
以随机事件A在大量重复试验中出现的稳定频率制作为随机事件A概率的估计值,这样寻得的概率称为后验概率。
计算公式是P(A)=limm/n
2.先验概率的定义
先验概率是通过古典概率模型加以定义的,故又称为古典概率。
古典概率模型要求满足两个条件:
(1)试验的所有可能结果是有限的;
(2)每一种可能结果出现的可能性(概率)相等。
若所有可能结果的总数为n,随机事件A包括m个可能结果。
(二)概率的性质
1、任何随机事件A的概率都是介于0与1之间的正数;
2、不可能事件的概率等于0;
3、必然事件的概率等于1。
(三)概率的加法和乘法
1、概率的加法
在一次试验中不可能同时出现的事件称为互不相容的事件。
两个互不相容事件和的概率,等于这两个事件概率之和。
P(a+b)=P(a)+P(b)
2.概率的乘法
A事件出现的概率不影响B事件出现的概率,这两个事件为独立事件。
两个独立事件的概率,等于这两个事件概率的乘积。
P(A1,A2…An)=P(A1),P(A2)…P(An)
二、正态分布
正态分布是一种连续型随机变量的概率分布。
(一)正态曲线
1.正态曲线函数
正态曲线的函数式是公式
标准正态分布的函数式是公式
2.正态曲线的特点
(1)曲线在Z=0处为最高点。
(2)曲线以Z=0处为中心,双侧对称。
(3)曲线从最高点向左右缓慢下降,并无限延伸,但永远不与基线相交。
(4)标准正态分布上的平均数为0,标准差为1。
(5)曲线从最高点向左右延伸时,在正负1个标准差是拐点。
(二)正态曲线的面积与纵线
1、累积正态分布函数
2、标准正态分布下面积的求法
3、正态曲线的纵线
(三)正态分布在测验计分方面的应用
1、将原始分数转换成标准分数
标准分数的意义:
第一,各科标准分数的单位是绝对等价的;第二、标准分数的正负和大小可以反映出考生在全体考分中所处的地位。
2、确定录用分数线
3、确定等级评定的人数
三、二项分布
(一)二项试验
满足以下条件的试验称为二项试验:
(1)一次试验只有两种可能结果,即成功和失败;
(2)各次试验相互独立,互不影响;(3)各次试验中成功的概率相等。
(二)二项分布函数
二项分布是一种离散型随机变量的概率分布。
用n次方的二项展开式来表达在n次二项试验中成功事件出现不同次数(X=0,1,…,n)的概念分布叫做二项分布。
二项展开式的通式(5.8)就是二项分布函数,运用这一函数式可以直接求出成功事件恰好出现X次的概率。
(三)二项分布图
从二项分布图可以看出,当p=q,不管n多大,二项分布呈对称形。
当n很大时,二项分布接近于正态分布。
当n趋近于无限大时,正态分布是二项分布的极限。
(四)二项分布的平均数和标准差
当二项分布接近于正态分布时,在n次二项实验中成功事件出现次数的平均数和标准差分别可以由公式(前提np≥5且nq≥5)
平均数——M=np标准差——r=npq1/2
(五)二项分布的应用
二项分布函eg:
1.某市参加一考试2800人,录取150人,平均分数75分,标准差为8。
问录取分数定为多少分?
解:
X~N(75.82)
Z=(x-#)/σx=(x-15)/8~N(0,12)
P=150/2800=0.053
0.5-0.053=0.447
Z=1.615
X=1.615*8+75≈88(分)
2.某高考,平均500分,标准差100分,一考生650分,设当年录取10%,问该生是否到录取分?
解:
Zo=(650-500)/100=1.5(X~N(500,1002)(Z~N(0,12)
Po=0.5-0.43319=0.06681=6.681%<10%
所以可录取。
四、抽样原理与抽样方法
(一)随机化原理
(二)抽样方法
简单随机抽样
等距抽样
分层抽样
两阶段随机抽样
五、抽样分布
(一)正态分布
1、样本平均数分布
(1)总体分布为正态,方差已知,样本平均数的分布为正态分布
公式:
(2)总体非正态,方差已知,样本容量足够大(n>30)为渐近正态分布
公式同上
2、方差及标准差分布
公式:
(二)t分布
公式:
1、特点:
⑴平均值为0
⑵以平均值0左右对称的分布
⑶变量取值从负无穷到正无穷
⑷当样本容量趋于无穷时,t分布为正态分布,方差为1。
2、t分布表的应用
3、样本平均数分布
(1)总体正态,方差未知,
公式:
(2)总体非正态,方差未知,满足n>30,近似t分布
(三)χ2分布
1、抽样原理
2、公式:
3、特点:
⑴χ2分布是正偏态分布
⑵χ2值都是正的
⑶χ2分布的和也是χ2分布
⑷如果df>2,这时μχ2=df,σ2χ2=2df
⑸χ2分布是连续型分布
4、χ2分布表
(四)F分布
1、F分布的原理
2、公式:
3、特点:
⑴正偏态分布
⑵正值
⑶当分子的自由度为1,分母的自由度为任意值时,F分布与分母自由度相同概率的t值的平方相等。
4、F分布表
第二节参数估计
一、点估计、区间估计与标准误
1、点估计
用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。
2、区间估计
以样本统计量的抽样分布(概率分布)为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。
区间估计涉及置信水平和置信区间。
二、总体平均数的估计
(一)、σ已知条件下总体平均数的区间估计
当总体σ已知,总体呈正态分布,样本容量无论大小时,或者当总体σ已知,总体虽不呈正态分布,但样本容量较大(n>30)时,样本平均数与总体平均数离差统计量均呈正态分布。
区间估计的计算公式为(6.8)和(6.9)。
(二)、σ未知条件下总体平均数的区间估计
1、σ未知条件下总体平均数的区间估计的基本原理
当总体σ未知,总体呈正态分布,样本容量无论大小时,或者当总体σ未知,总体虽不呈正态分布,但样本容量较大(n>30)时,样本平均数与总体平均数离差统计量均呈t分布。
区间估计的计算公式为(6.10)和(6.11)。
2、小样本的情况
3、大样本的情况
可以用正态分布近似处理。
三、标准差和方差的区间估计
第三节假设检验
一、假设检验的原理
利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。
(一)假设
假设检验一般有两个相互对立的假设。
即零假设(或称原假设、虚无假设、解消假设)和备择假设(或称研究假设、对立假设)。
假设检验是从零假设出发,视其被拒绝的机会,从而得出决断。
(二)小概率事件
把出现小概率的随机事件称为小概率事件。
小概率事件是否出现,这是对假设作出决断的依据。
(三)显著性水平
拒绝零假设的概率称为显著性水平。
显著性水平和可靠性程度之间的关系是:
两者之和为1。
(四)统计决断的两类错误及其控制
如果拒绝了属于真实的零假设,即如果样本统计量的总体参数正是假设的总体参数,但是由于样本统计量的值落入了拒绝区域。
而零假设遭到拒绝,这时就会犯第一类型的错误。
这种错误的可能性大小正是显著性水平的大小,故又称这类错误为α错误。
如果保留了属于不真实的零假设,就会犯第二类型的错误。
犯这种“假设属伪而被保留”的第二类错误的概率,等于β值,故又称这类错误为β错误。
要使第一类错误的概率保持在需要的水平上,而控制第二类错误的概率,有以下方法:
(1)利用已知的实际总体参数与假设参数值之间的大小关系,合理安排拒绝领域的位置,选择双侧检验还是单侧检验,左侧检验还是右侧检验;
(2)加大样本容量。
二、样本与总体样本平均数差异的检验
总体平均数的显著性检验的适用公式与相应的参数估计一脉相承。
(一)σ已知条件下总体平均数的显著性检验
(二)σ未知条件下总体平均数的假设检验
1、小样本的情况
2、大样本的情况
三、两样本平均数差异的检验
(一) 相关样本平均数差异的显著性检验
两个样本内个体之间存在着一一对应的关系,这两个样本称为相关样本。
相关样本有以下两种情况:
(1)用同一测验对同一组被试在试验前后进行两次测验,所获得的两组测验结果是相关样本。
(2)根据某些条件基本相同的原则,把被试一一匹配成对,然后将每对被试随机地分入实验组和对照组,对两组被试施行不同的实验处理之后,用同一测验所获得的测验结果,也是相关样本。
相关样本平均数差异的显著性检验方法和步骤:
(1)提出假设
(2)选择检验统计量并计算其值。
在小样本情况下,其检验统计量为公式(7.9);在大样本情况下用公式(7.12)。
(3)确定检验形式
(4)统计决断
(二) 独立样本平均数差异的显著性检验
两个样本内的个体是随机抽取的,它们之间不存在一一的对应关系,这样的两个样本称为独立样本。
1、独立大样本平均数差异的显著性检验
两个样本容量n1和n1都大于30的独立样本称为独立大样本。
独立大样本平均数差异的显著性检验所用的公式是(7.17)。
2、独立小样本平均数差异的显著性检验
两个样本容量n1和n1均小于30,或其中一个小于30的独立样本称为独立小样本。
独立小样本平均数差异的显著性检验方法:
(1)方差齐性时
如果两个独立样本的总体方差未知,经方差齐性检验表明两个总体方差相等,则统计量公式为(7.23)-(7.25),这三个公式是等价的。
(2)方差不齐性时
对于方差不齐性的两个独立样本平均数差异显著性检验,需要用校正的t'作为检验统计量,用公式(7.26),t'的临界值则用公式(7.29)和(7.32)来计算。
四、方差齐性检验
1、F分布
若从方差相同的两个正态总体中,随机抽取两个独立样本,以此为基础,分别求出两个相应总体总体方差的估计值,这两个总体方差估计值的比值称为F比值,F比值的抽样分布称为F分布。
F分布的形态随F比值分子和分母中自由度的变化而形成一簇正偏态分布。
一般情况下,经常应用的是右侧F检验,计算F值时,将大的总体方差估计值作为分子,小的作为分母。
2、两个独立样本的方差齐性检验
用公式(7.35)。
3、两个相关样本的方差齐性检验
用公式(7.38)。
五、相关系数的显著性检验
(一)积差相关系数的显著性检验
1、ρ=0
2、ρ≠0
(二)其他类型的相关系数的显著性检验
略
(三)相关系数差异的显著性检验
1、r1,r2分别由两组彼此独立的被试得到
2、两个样本相关系数由同一组被试算得。
第四节方差分析
一、方差分析的原理与基本过程
(一)基本原理:
综合的F检验
1、综合虚无假设与部分虚无假设
2、方差的可分解性
(二)基本过程
1、求平方和
⑴总平方和⑵组间平方和⑶组内平方和
2、计算自由度
3、计算均方
4、计算F值
5、查F值表进行F检验并做出决断
6、陈列方差分析表
二、完全随机设计的方差分析
为了检验某一个因素多种不同水平间的差异的显著性,将从同一个总体中随机抽取的被试,再随机地分入各实验组,施以各种不同的实验处理以后,用方差分析法对这多个独立样本平均数差异的显著性进行检验,称为完全随机设计的方差分析。
1、n相等的情况
2、n不相等的情况
3、运用样本统计量进行组间与组内方差的F检验
三、随机区组设计的方差分析
用方差分析法对多个相关样本平均数差异所进行的显著性检验,称之为随机区组设计的方差分析
每一区组内被试的人数分配有以下三种方式:
(1)一个被试作为一个区组;
(2)每一区组内被试的人数是实验处理数的整数倍;
(3)区组内以一个团体为一个基本单元。
区组平方和等数据的计算用公式
四、两因素方差分析
以两因素完全随机设计为例
1、基本特点:
⑴研究中有两个自变量,每个自变量有两个或多个水平
⑵如果一个自变量有p个水平,另一个自变量有q个水平,实验中就含有p×q个处理。
2、交互作用:
单因素与多因素的区别
一个因素的各水平在另一个因素的不同水平上变化趋势不一致,以致如果只区分每个因素的单独作用,并不能揭示因素水平之间的复杂关系。
五、事后检验
如果组间差异显著,就必须多各实验处理组的多对平均数进一步分析,做深入比较,判断究竟是哪一对或哪几对的差异显著,哪几对不显著,确定两变量关系的本质。
这就是事后检验,或事后多重比较。
(一)为什么不能用t检验对多个平均数的差异进行比较
同时比较的平均数越多,其中差异较大的一对所的t值超过原来临界值的概率就越大
(二)N-K检验法
步骤:
(1)把要比较的各个平均数从小到大等级排列
(2)根据比较的等级r,自由度df,查
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理 统计 测量