心理统计.docx
- 文档编号:30000813
- 上传时间:2023-08-04
- 格式:DOCX
- 页数:21
- 大小:26.27KB
心理统计.docx
《心理统计.docx》由会员分享,可在线阅读,更多相关《心理统计.docx(21页珍藏版)》请在冰豆网上搜索。
心理统计
心理统计
一、描述统计
(一)统计图表
1、统计图
①直方图:
以矩形的面积表示连续性随机变量次数分布的图形。
横坐标等距分组点(分组区间上下限),纵坐标频数。
②次数多边形图:
表示连续性随机变量次数分布的线性图。
横坐标各分组组中值,纵坐标频数。
③累加次数分布图:
A累加直方图:
横坐标与直方图相同,纵坐标累加频数。
B累加曲线:
递加线。
横坐标分组区间的精确上限或下限,纵坐标累加频数。
正偏态M>Md>Mo负偏态M (注意: ①、②、③属于次数分布图) ④条形图: 表示离散型数据资料。 以条形长短表示各事物间数量的大小和差异。 ⑤圆形图: 描述间断性资料。 显示各部分在整体中所占的比重大小,各部分比较 ⑥线形图: 连续性资料,表示两个变量间的函数关系,或某现象在时间上的发展 A折线图: 由条形图中每个条形顶部的中点连接而成 B曲线图: 折线分布修匀后比较平滑的线形图。 ⑦散点图: 用相同大小的圆点的多少或疏密表示统计资料数量大小以及变化趋势 用于表示两种现象间相关程度。 2、统计表 基本结构和要素: 表号、名称、标目、数字、表注。 ①简单次数分布表: 依据每一个分数值在一列数据中出现的次数或总计数资料编 制成的统计表。 ②分组次数分布表: 数据量大时,把数据分到若干个分组区间,统计各个组别中 数据个数,用列表呈现出来。 ③相对次数分布表: 各组的实际次数转化为相对次数,即用频数比率(f/N)或 百分比(f/Nx100%)表示次数。 ④累加次数分布表: 把各组的次数由下而上,或由上而下累加在一起,最后一组 的累加次数应等于数据的总次数。 ⑤双列次数分布表: 相关次数分布。 有联系的两列变量用同一个表表示次数分布 ⑥不等距次数分布表: 如工资级别、年龄分组等。 (二)集中量数 1、算术平均数 ①未分组数据: M=∑Xi/N ②用估计平均数: M=AM+∑x`/N(x`=Xi–AM) ③用次数分布表: M=∑fXc/N(Xc组中值,f各组次数) 2、中数 (1)未分组数据 ①无重复数值 a数据为奇数: Md=(N+1)/2位上数 b数据为偶数: Md=(N+1)/2与N/2位上数相加除以2 ②有重复数值 a重复数值没有位于数列中间时,方法同上。 b重复数值位于数列中间时,数据为奇数: (N+1)/2位上数的组中值 c重复数值位于数列中间时,数据为偶数: N/2位上数的上限 (2)分组数据 3、众数 直接观察法。 皮尔逊经验法: MO=3Md-2M 4、平均数、中数、众数的关系 M>Md>MOM 正偏态负偏态 (三)差异量数 1、离差与平均差 离均差: xi= 平均差: A.D.= 2、方差与标准差 S2= S= 3、变异系数 CV= (四)相对量数 1、百分位数 Pp=Lb+ 2、百分等级 PR= 3、标准分数 Z= (五)相关量数 1、皮尔逊积差相关 使用前提: a成对的数据。 b总体正态。 c连续变量。 d关系直线性。 r= 差法公式: 减差法: r= 加差法: r= 2、斯皮尔曼等级相关 适用: 只有2列变量,等级变量性质,有线性关系,解决称名数据和顺序数据, 对总体不作要求。 ①等级差数法(N<30): rR= ②等级序数法: rR= ③有相同等级时: rRC= ∑x2=∑CX=∑ ∑y2=∑CY=∑ 3、肯德尔等级相关 (1)肯德尔W(和谐)系数: 适用: 两列以上的等级变量,让K个被试(评价者)对N件事物进行等级评定,排出一个等级顺序。 最小的等级为1,最大为N。 ①W=S=(0 ②有相同等级时: W=∑T=∑ (2)肯德尔U(一致性)系数: 适用: 评价者采用对偶比较的方法,即把N件事物两两配对,可配成对 ,然后对每一对中的事物进行比较。 U= 完全一致U=1,完全不一致U=-1/K(K为奇数),U=-1/(K+1)(K为偶数) 4、点二列相关 考察两列观测值,一个为连续变量,另一个为二分称名变量。 多用于评价由是非测验题目组成的测验的内部一致性问题。 rpb=(-1 5、二列相关 两列数据属于正态分布,一列为等距或等比的数据,另一列人为划分二分变量 rb=rb= 6、φ相关 列联系数,可以运用列联表计算。 两变量都是真正的二分变量。 rφ= 二、推断统计 (一)推断统计的数学基础 1、概率 (1)含义: 随机是指在一定条件下可能出现也可能不出现的,表明随机事件出现可能性大小的客观指标就是概率。 (2)基本性质: ①任何一个随机事件A的概率都是非负 ②在一定条件下必然发生的必然事件的概率为1 ③在一定条件下必然不发生的事件,即不可能事件的概率为0 ④加法定理: P(A+B)=P(A)+P(B)A、B互不相容。 ⑤乘法定理: P(AB)=P(A)XP(B)A、B独立事件,同时发生。 2、正态分布 (1)含义: 由棣.莫弗1733年发现,拉普拉斯、高斯做出了贡献,又叫高斯分布。 (2)特征: ①对称。 平均数、中数、众数相等,此点y值最大(0.3989) ②中央点最高,然后逐渐向两侧下降,先向内弯,再向外弯,拐点正负1个标准差处,向靠近基线处无限延伸,但终不能与基线相交。 ③正态曲线下面积为1 ④是一族分布。 平均数相同下,标准差大,分布低阔;标准差小,分布高狭 标准正态分布,u=0,δ2=1 ⑤正态分布曲线下,标准差与概率(面积)由一定的数量关系。 (3)皮尔逊偏态量数法: SK= SK=0,分布对称;SK为正数,正偏态;SK为负数,负偏态。 (4)T分数 麦克尔创用。 T=10Z+50 3、二项分布 (1)离散型随机变量的概率分布。 贝努里创始。 贝努里分布。 (2)二项使用前提条件: ①任何一次试验恰好有两个结果 ②共有n次试验 ③每次试验各种独立 ④某种结果出现的概率在任何一次试验中都是固定的 (3)二项分布的具体定义: 设有n次试验,各次试验是彼此独立的,每次试验某事件出现的概率都是p,某事件不出现的概率是q(等于1-p),则对以某事件出现X次(0,1,2,….,n)的概率分布为: b(x.n.p)=Cnxpxqn-xCnx= (4)二项分布近似正态分布,当p 4、抽样原理与抽样方法 (1)特点与作用: ①节省人力及费用。 ②节省时间,提高调查研究的时效性 ③保证研究结果的准确性。 (2)基本原则: 随机化原则 (3)抽样方法: ①简单随机抽样。 抽签法,随机数字法。 (最符合随机原则) ②等距抽样。 ③两阶段随机抽样。 ④分层随机抽样。 各层变异要小,层与层之间变异要大。 5、抽样分布(样本分布) (1)正态分布及渐近正态分布 ①样本平均数的分布 总体正态(或非正态时,满足n>30),方差已知,样本平均数分布为正态 ②方差和标准差的分布 总体正态,满足n>30,方差和标准差的分布渐近正态 (2)t分布 高赛特。 学生氏分布。 左右对称,峰态比较高狭,分布形状随样本容量n-1变化 t= ①特点: a平均值为0。 b变量取值-∝~+∝。 c.n趋于∝,正态分布;n-1>30,接近正态;随n-1减少,离散程度(方差)越大。 ②t分布有三方面数值构成: t值、自由度、显著性水平 ③样本平均数分布: 总体正态(或非正态,n>30),方差未知,为t分布 (3)X2分布 刻画正态变量二次型。 X2= 特点: a正偏态分布。 n或n-1越小,分布越偏斜。 df越大,接近正态 bX2值都是正值。 c具有可加性。 d当df>2,X2分布的平均数: ,方差 e连续型分布,但有些离散型分布近似X2分布。 f曲线下面积为1 (4)F分布 F= 特点: ①正偏态分布。 随df1、df2的增加而渐趋正态分布。 ②F为正值,因它是两个方差之比率。 ③当分子自由度为1,分母自由度与t分布自由度相同,F=t2(双侧) (二)参数估计 1、点估计、区间估计与标准误 (1)良好估计量的标准: ①无偏性。 Xu,S2n-1=∑x2/(N-1)σ2 ②有效性。 无偏估计变异小,有效性高。 ③一致性。 ④充分性。 样本充分反映总体。 (2)显著性水平: 估计总体参数落在某一区间时,可能反错误的概率。 a 置信度(置信水平): 1-a 2、总体平均数u的估计 (1)正态分布。 总体正态(或非正态,n>30),σ2已知。 (2)t分布。 总体正态(或非正态,n>30),σ2未知。 (3)计算步骤: ①求X,S ②求σxI.σ2已知,σx=II.σ2未知,σx= ③确定显著性水平。 a=0.05或0.01 ④查表(t分布或Z正态分布) ⑤计算置信区间: I.X-Za/2σx 3、标准差的区间估计 (1)当n>30,渐进正态分布 XS=σ=Sn-1σS=(当σ未知,取其无偏估计Sn-1) Sn-1-Za/2σS<σ (2)当n<30,先求方差的区间,然后开方 4、方差的区间估计 <σ2<或<σ2<(df=n-1) 5、两总体方差之比的区间估计 (df1=n-1,df2=n-1) (三)假设检验 1、假设检验的原理 (H0虚无假设,H1备择假设) 接受H0拒绝H0 H0为真 正确 I型错误,a型错误,弃真错误 H0为假 II型错误,β型错误,取伪错误 正确 2、样本与总体平均数差异的检验 总体分布 总体方差 检验方法 正态 已知 Z检验SEX=Z= 未知 t检验SEX=t=(df=n-1) 非正态 n>30 已知 Z检验同上 未知 t检验同上 3、两样本平均数差异的检验 总体分布 总体方差 样本情况 检验方法 正态 已知 独立 Z检验SEDX= 相关 Z检验SEDX= 未知 σ21=σ22 独立 t检验SEDX= σ21≠σ22 独立 n1≠n2 t/检验SEDX= n1=n2 t检验SEDX= 不考虑σ21、σ22 相关 r未知 t检验SEDX= r已知 t检验SEDX= 非正态 已知 独立 n1,n2 >30 Z/检验SEDX= 相关 n>30, Z/检验SEDX= 未知 独立 n1,n2 >30 Z/检验SEDX= 相关 n>30, Z/检验SEDX= 4、方差齐性的检验(检验σ21=σ22是否相等)已考 F=S2大/S2小(df1=n1-1,df2=n2-1)若小于F0.05,则差异不显著,即齐性 5、相关系数的显著性检验 (1)积差相关 ①p=0,r分布近似正态。 t检验。 H0: p=0,H1: p≠0t=(df=n-2) 当t>t0.05/2,拒绝H0,r不是来自p=0的总体,即r是显著的。 ②p≠0,r分布不是正态。 Z检验。 把p、r转换成费舍Zr SEZr=Z= (2)点二列相关(p=0) ①当N<50,和进行差异t检验 ②当N>50,|rpb|>时,rpb在0.05水平显著; |rpb|>时,rpb在0.01水平显著 (3)二列相关(p=0) Z= (四)方差分析(单侧F检验) 斯内德克。 分析实验数据中不同来源的变异对总变异的贡献大小,从而确定实验中的自变量是否对因变量有重要影响。 1、方差分析的原理与基本过程 (1)方差分析的基本原理: 综合的F检验 处理两个以上的平均数之间的差异,综合的虚无假设H0: u1=u2=u3 检验综合虚无假设是方差分析的主要任务。 依据方差的可分解性。 (2)SST= SSB= SSW=SST-SSB= (3)方差分析的基本假定: a总体正态分布b变异的相互独立性 c各实验处理内的方差要一致(无显著差异) (4)方差齐性检验: F=S2max/S2min 2、完全随机设计的方差分析 (1)设H0: u1=u2=u3=….. H1: u1≠u2≠u3≠…..(1、2、3……分别表示不同的处理) (2)计算平方和 SST= SSB= SSW=SST-SSB= 注意: 各实验组处理样本容量不同时: SSB= (3)计算自由度 dfT=N-1dfB=K-1dfW=N-K=K(n-1) (4)计算均方 MSB=MSW= (5)计算F,进行F检验,作出判断 F=MSB/MSW(dfB、dfW)比较F,F0.05 (6)列出方差分析表 变异来源 平方和 自由度 均方 F P 组间效应 SSB dfB MSB MSB /MSW >或<0.05 组内效应 SSW dfW MSW 总变异 SST dfT 2、随机区组设计的方差分析 重复测量设计的或组内设计的方差分析。 对于每一区组而言,它应该接受全部实验处理;对于每种实验处理而言,它在不同的区组中重复的次数应该相同。 由于同一区组接受所以实验处理,使实验处理之间有相关,因此又称相关组设计或被试内设计。 与完全随机设计相比,最大优点使考虑到个别差异的影响。 被试之间性质不同导致产生的差异为区组效应。 (1)设H0: u1=u2=u3=….. H1: u1≠u2≠u3≠…..(1、2、3……分别表示不同的处理) (2)计算平方和 SST= SSB= SSR= SSE=SST-SSB= (3)计算自由度 dfT=N-1dfB=K-1dfR=n-1dfE=(n-1)(K-1)=dfT-dfB-dfR (4)计算均方 MSB=MSR=MSE= (5)计算F,进行F检验,作出判断 FB=MSB/MSE(dfB、dfE)FR=MSR/MSE(dfR、dfE) 若FB>F0.05,则实验处理效果显著(差异显著) 若FR>F0.05,则区组效应显著(差异显著) (6)列出方差分析表 变异来源 平方和 自由度 均方 F P 组间效应 SSB dfB MSB MSB/MSE >或<0.05 区组效应 SSR dfR MSW MSR/MSE 误差效应 SSE dfE MSE 总变异 SST dfT 4、两因素方差分析(两因素完全随机设计) (1)计算平方和 SSt= SSb= SSw=SSt–SSb= SSA= SSB= SSAxB= (2)计算自由度 dft=N-1dfA=k-1dfB=L-1dfAxB=(k-1)(L-1) dfw=N-KL=dft–dfA–dfB–dfAxB (3)计算均方 MSA=MSB=MSAxB=MSW= (4)计算F,进行F检验,作出判断 FA=MSA/MSW(dfA、dfW)FB=MSB/MSW(dfB、dfW) FAxB=MSAxB/MSW(dfAxB、dfW) 若FA>F0.05,则A因素的主效应显著 FAxB>F0.05,则A、B因素的交互作用显著 (5)列出方差分析表 变异来源 平方和 自由度 均方 F P 组间 A效应 SSA dfA MSA MSA/MSW >或<0.05 B效应 SSB dfB MSB MSB/MSW AxB效应 SSAxB dfAxB MSAxB MSAxB/MSW 组内 SSW dfW MSW 总变异 SSt dft 5、事后检验(N-K检验法) (1)要比较的平均数,从小到大作等级排列或 (2)根据等级r,自由度dfE(或dfW),差q0.05(从2—>r) (3)求样本平均数的标准误 区组: SEX=组间: SEX=各组容量不等时: SEX= (4)不同等级(2—>r)的q0.05xSEX (5)(Xi–Xj)与q0.05xSEX比较,作K(K-1)/2次(K个平均数) (6)若>,则差异在0.05水平显著 (五)回归分析 1、一元线性回归分析 (1)平均数法 ①设Y=a+bX ②把成对数据按奇偶顺序分两组,并求和。 ③求和后2式联立,组成二元一次方程组,求出a,b。 ④把a,b代入Y=a+bX (2)最小二乘法(使Yi–Y的平方和最小,即误差平方和) ①b= ②a= ③把a,b代入Y=a+bX (3)回归系数b与相关系数r的关系 byx=bxy=r= 2、一元线性回归方程的检验 (1)方差分析 ①计算平方和 SST= SSR= SSE=SST–SSR= ②计算自由度 dfT=N-1dfE=N-2dfR=1 ③计算均方 MSR=MSE= ④计算F,进行F检验,作出判断 F=MSR/MSE(dfR、dfE)比较F,F0.05 ⑤列出方差分析表 变异来源 平方和 自由度 均方 F P 回归 SSR dfR MSR MSR /MSE >或<0.05 残差 SSE dfE MSE 总变异 SST dfT (2)回归系数b的显著性检验 ①设H1: B=0(总体回归系数) H0: B≠0 ②SEb= ③t=(df=N-2) ④比较t,t0.05/2,若>,则b显著,即回归方程显著 注意: b的显著性检验,与方差分析一致。 t2=F (3)测定系数(X和Y的线性关系的程度) r2= 3、一元线性回归方程的应用 (1)点预测 把X代入Y=a+bX,求Y (2)区间预测 ①同点预测 ②求SYX=(误差的标准差) ③Y-1.96SYX (六)卡方检验 1、拟合度检验(单侧X2检验,单因素检验,实际次数与理论次数差异) ①H0: f0=fe H1: f0≠fe ②fe=Nx1/K ③X2= ④df=K-计算理论次数所用的统计量 ⑤比较X2、X20.05,若>,则P<0.05,拒绝H0,接受H1,差异显著。 2、独立性检验 分析两个或以上因素、计数资料两类变量间的关联性、依存性。 (1)①H0: 二因素(或多因素)之间是独立的或无关联的 H1: 二因素(或多因素)之间是关联的或差异显著 ②fe= ③X2= ④df=(R-1)(C-1) ⑤比较X2、X20.05,若>,则P<0.05,拒绝H0,接受H1,差异显著。 (2)独立样本四格表X2检验(各单元格fe≥5) X2=(df=1) (3)相关样本四格表X2检验 X2=(df=1) (4)四格表X2值的近似校正 独立: X2=相关: X2= (七)非参数检验 1、独立样本均值差异的非参数检验 (1)秩和检验法 情况1: 两样本容量均小于10(n1≤10,n2≤10) ①两样本数据混合后由小到大排列,标上等级 ②若n1≤n2求样本n1的各数据的等级相加T ③T与T1、T2比较,若T≤T1或T≥T2,则差异显著, 若T1≤T≤T2,则差异不显著 情况2: n1>10,n2>10(秩和T分布接近正态分布) ①两样本数据混合后由小到大排列,标上等级 ②若n1≤n2求样本n1的各数据的等级相加T ③uT=σT=Z= ④比较Z和Z0.05(1.96),若>,则差异显著 (2)中数检验法 H0: 两个独立样本是从具有相同中数的总体中抽取的 ①两样本数据混合后由小到大排列 ②求出混合排列的中数 ③制四格表 大于中数 小于中数 组1 A B 组2 C D ④X2= 2、相关样本均值差异的非参数检验 (1)符号检验法 H0: 配对资料差值来自中位数为0的总体 A.N≤25 ①求(Xi-Yi)的正负号,求出n+、n-(差值为0不计算在内) ②r=min(n+,n-) ③根据N,r查表。 若r>r0.05,差异不显著。 B.N>25(近似正态分布) u=Np= σ= Z= 校正公式: Z= (2)符号等级检验法 A.N≤25 ①Xi-Yi=Di按[Di]按小到大作等级排列(0除外) ②在各等级前加上原来的正负号 ③求T+、T-T=min(T+,T-) ④查表,T>T0.05时,差异不显著 配对组1(Xi) 配对组2(Yi) 差值(D) [D]排等级 添符号 B.N>25(T分布近似正态分布) uT= σT= Z=
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 心理 统计