人力资源应用统计心理统计学-陈毅文.pptx
- 文档编号:1772739
- 上传时间:2022-10-24
- 格式:PPTX
- 页数:158
- 大小:5.88MB
人力资源应用统计心理统计学-陈毅文.pptx
《人力资源应用统计心理统计学-陈毅文.pptx》由会员分享,可在线阅读,更多相关《人力资源应用统计心理统计学-陈毅文.pptx(158页珍藏版)》请在冰豆网上搜索。
心理统计陈毅文中国科学院心理研究所E-mail:
电话:
64861897心理统计学课程的知识结构描述统计:
研究如何整理实验或调查得来的大量数据,描述一组数据的全貌。
包括统计图表,各类统计指标。
推断统计:
研究如何通过局部数据所提供的信息推断总体的情况。
包括:
参数估计、假设检验、方差分析、回归分析、卡方检验和非参数分析。
1、绪论数据类型划分:
计数数据与测量数据称名数据、顺序数据、等距数据、比率数据离散数据、连续数据总体、样本和个体次数、比例、百分比、比率、频率、概率统计量、参数及其联系数据分组:
单变量值分组组距分组:
分组步骤、精确上下限常用统计表简单次数分布表分组次数分布表相对次数分布表:
用频数比率或百分比表示累加次数分布表双列次数分布表:
相关次数分布表2、统计图表统计图:
条形图、饼图直方图、次数多边形图累加次数分布图:
累加直方图、累加曲线线形图散点图条形图和直方图的区别3、集中量数集中趋势的度量数据的中心位置、代表包括:
众数、中数、算术平均数、加权平均数、几何平均数、调和平均数。
众数(mode,用Mo表示)定义:
一组数据中出现次数最多的变量值计算方法:
直接观察求众数:
次数最多的变量值皮尔逊经验法金氏插补法优缺点优点:
计算简单,容易理解;不受极端值的影响;缺点:
不稳定,受分组影响,也受样本变动影响;反应不灵敏;用观察法和公式法得到的众数只是一个估计值;众数不能做进一步代数运算;应用数据类型为类别或顺序数据时需要快速而粗略地寻求一组数据的代表值时当一组数据出现不同质的情况时,用众数表示典型情况数据中有极端数据时粗略估计次数分布的形态时,可用平均数和众数之差作为次数是否偏态的指标。
中数(median,用Md或Mdn、Me表示)定义数据按顺序排列后处于中间位置的变量值有一半数据比它大,一半数据比它小中数可能是数据中的某一个,也可能不是原有的数分组数据:
计算方法未分组数据无重复数据先对数据排序数据个数为奇数时,中间位置上的数即为中数;数据个数为偶数时,居于中间位置两个数的平均数为中数有重复数据当重复数据没有位于数列中间时,与无重复数据计算方法相同当重复数据位于数列中间时,如数列11、11、11、11、13、13、13、17、17,其中数为12.66,如何计算?
组距分组数据用公式计算优缺点优点计算简单,容易理解不受极端值影响缺点反应不灵敏受抽样的影响大计算时先要对数据进行排序不能进一步代数运算应用数据类型为顺序数据时数据中有极端值或个别数据不清楚时需要快速估计一组数据的代表值时数据分布偏度较大时平均数(Mean,用M或表示)定义与计算方法简单平均数:
未分组数据加权平均数:
分组数据几何平均数:
比率数据调和平均数:
比率数据平均数的性质:
1.离均差总和为0;2.一组数据中,每个数都加上一常数c,其平均数等于原来的平均数加上常数c;3.一组数据中,每个数都乘以一个常数c,其平均数等于原来的平均数乘以常数c优缺点优点计算简单、严密、简明易解反应灵敏适合进一步代数运算较少受抽样变动的影响缺点易受极端值的影响数据偏态较大时平均数对总体的代表性差计算和应用的原则同质性原则数据的变异不能太大平均数与个体数值相结合的原则数据分布的偏度不能太大众数、中数和均值的比较1.平均数、中数和众数的关系在一个正态分布中,三者相等在正偏态分布中,MMdMo在负偏态分布中,MMdMo一般偏态情况下,Md离M较近,而离Mo较远,皮尔逊经验关系:
2、众数、中数、均值的特点与应用场合众数是一组数据分布的峰值所对应的随机变量的值,它是一种位置代表值,不受极端值的影响。
缺点是不具有唯一性。
它主要用于定类数据的集中趋势度量;中位数是一组数据中间位置上的代表值,特点是不受数据极端值的影响。
主要适合于定序数据的集中趋势的测度值;均值是对于数值型数据计算的,而且利用了全部数据信息,它具有良好的数学性质,应用比较广泛。
缺点是易受极端数据的影响,对于偏态分布数据,均值代表性较差。
当数据为偏态分布,特别是偏度较大时,应选择众数或中位数等位置代表值。
4、差异量数(离散程度的度量)全距(range):
R=Xmax-Xmin四分位差(quartiledeviation):
Q=(Q3-Q1)/2平均差(meandevation)用A.D.或M.D.表示方差(variance)与标准差(standarddeviation)平方和:
方差:
标准差:
方差的算术平方根例4.1求下列数据的方差、标准差15,16,13,11,12,10,11例4.2下列数据是从某个总体中抽取的一个随机样本,求该样本数据的方差和标准差。
10,8,8,6,7,5,9,5,4,6由各小组的标准差、方差求总标准差、方差样本方差与总体方差的区别和联系:
1在计算上,总体方差是用数据个数或总频数去除离差平方和,而样本方差则用样本数据个数或总频数减一去除离差平方和;2样本方差是统计量,用S2表示;总体方差是总体参数,用表示。
()当n很大时,S与相差很小,前者是后者的无偏估计。
方差、标准差的性质:
(1)若y=x+c,x和y是随机变量,c为常数,则
(2)若y=cx,c为常数,则(3)若X和Y独立,则标准差的应用变异系数(coefficientofvariation):
相对离散程度标准分数(standardscore):
表示标准测验分数Z=aZ+b异常值的判断:
是否在正负三个标准差内5、相对量数:
百分位数、百分等级、标准分数百分位数:
次数分布中对应于某个特定百分点的原始分数。
第m个百分点就是这样一个点,次数分布中有m%的数据小于等于这个数,有(100m)%的数据大于等于这个数。
记为Pm计算公式应用较少受极端值的影响;分布非正态时,做常模用。
百分等级定义:
次数分布中低于某个原始分数的次数百分比,用PR表示。
百分位分数是先确定某个百分点m,然后去求相应的百分位分数Pm。
而求百分等级分数正好相反,事先知道次数分布中的一个原始分数,再求该分数在分布中所处的相对位置。
计算公式标准分数定义以标准差为单位表示一个原始分数在团体中所处的相对位置,是一种相对位置量数。
计算公式性质Z分数无实际单位,其均值为0,方差为1;如果原始分数的分布为正态分布,则Z分数的分布也为正态分布。
优点可比性;可加性;明确性;稳定性应用比较不同性质的观测值;计算不同质的观测值的总和或均值;表示标准测验分数;异常值的取舍(常采用正负三个标准差)6、相关分析相关:
正相关、负相关、零相关、完全相关、不完全相关;相关系数:
r由散点图判断相关程度积差相关:
适用条件:
X、Y等距、正态、具有线性关系;计算公式:
相关系数的合并查费舍Z-r转换表,先将各样本的r转换成费舍Z分数;求每一样本的Z分数之和;求平均Z分数,即:
再查转换表,将转换成相应的r值,即平均的r.等级相关(rankcorrelation):
适用条件:
X、Y顺序变量或等距非正态,具有线性关系计算公式:
肯德尔和谐系数(Kendallcoefficientofconk个co评rd价an者c对e)n:
个对象进行等级评定,求评价一致性。
点二列相关(point-biserialcorrelation)X为二分变量,Y等距、正态,两变量具有线性关系计算公式:
二列相关(biserialcorrelation)X、Y等距、正态,X被人为划为二类计算公式:
多列相关(multiserialscorrelation)X、Y等距、正态,X被人为划为多类四分相关(tetrachoriccorrelation)X、Y等距、正态,都被人为划为两类;相关phicoefficientX、Y都是二分变量列联相关contingencycoefficientX、Y多于两个类别7、概率及其分布随机试验、事件、偶然事件、必然事件、不可能事件、简单事件、样本空间事件的运算:
交、并、补概率:
古典概率:
满足:
(1)结果有限;
(2)各结果发生的概率相等P(A)=m/n概率的统计定义条件概率:
当某一事件B已知发生时,求事件A发生的概率,称为事件B发生条件下事件A发生的条件概率,记为P(A|B)。
一般来说,P(A|B)P(A)独立事件:
两个事件中不论哪个事件发生与否并不影响另一个事件发生的概率,称这两个事件相互独立。
两个事件A、B是相互独立,当且仅当,P(AB)=P(A)P(B)加法公式:
P(A+B)=P(A)+P(B)-P(AB)若A和B互斥(即没有公共的样本点或两事件不能同时发生),则P(A+B)=P(A)+P(B)乘法公式:
P(AB)=P(A)P(B|A)=P(B)P(A|B)若A、B独立,则P(AB)=P(A)P(B)排列组合公式:
概率分布分布类型按随机变量是否连续划分:
离散分布与连续分布按函数来源划分:
经验分布与理论分布。
经验分布是指根据观察或试验所获得的数据而编制的次数分布;而理论分布指随机变量的概率分布数学模型,或按照某种数学模型计算出总体的次数分布。
按概率分布所描述的数据特征划分:
基本随机变量分布与抽样分布。
抽样分布指样本统计量的理论分布,如样本的平均数、两平均数之差、方差、标准差、比例、相关系数、回归系数等。
基本随机变量分布与抽样分布标准差与标准误差抽样分布的标准差称为标准误差,简称标准误。
中心极限定理(CentralLimittheorem):
设从均值为,方差为有限的任意一个总体中抽取大小为的样本当充分大时n样本均值X的抽样分布近似服从均值为,方差为的正态分布。
二项分布二项分布应满足的条件有n次重复试验每次试验的结果只有两个可能的结果,“成功”或“失败”每次试验中“成功”或“失败”的概率相同各次试验相互独立概率公式、数学期望、方差正态分布分布密度函数图形特点对称(但对称的分布不一定是正态分布)。
平均数、中数、众数三者相等中央点(均值点)最高然后逐渐向两侧下降,拐点恰好是一个标准差的地方正态曲线下与X轴围的面积为1,平均数左右各占0.5平均数改变中心的位置,而方差改变分布的形状均值为0,方差为1的正态分布称为标准正态分布。
所有的正态分布都可以通过Z分数公式转换为标准正态分布。
正态分布曲线下,标准差与概率有一定的数量关系:
平均数正负一个、两个、三个标准差内包括的面积(概率)分别为:
68.26%、95.45%、99.73%标准正态分布表的编制及其应用标准正态分布表有三列:
Z分数函数值Y概率值P。
分布密度函数f(x)在Z分数点与平均数之间的面积。
标准正态分布表的使用已知Z分数求概率已知概率求Z分数已知概率值或Z分数求Y值已知Z分数求原始分数X=+Z次数分布是否正态的检验方法皮尔逊偏态量数法正态分布中,M、Md、Mo三者相同;在偏态分布中,平均数李众数较近而离中数较远;偏态计算公式:
SK=(M-Mo)/S或SK=3(M-Md)/S峰度、偏度检验法累加次数曲线法:
将一般分布的累加概率与标准正态分布累加概率相比较。
正态分布理论在测验中的应用化等级评定为测量数据如果评定的心理量是正态的,可将等级评定通过概率转化为等距的测量数据。
确定测验题目的难易度测验题目的难易度一般用通过的百分数表示,但百分数不是等距量表,要比较不同项目的难度距离,通常需要将难易百分数根据正态分布概率转化为难度分数。
在能力分组或等级评定时确定人数若假定能力是正态分布,如果将能力分组,各组人数应是多少,才能使分组或评定等级构成等距量表。
测验分数的正态化可以将非正态的原始分数转换成正态分布T分数:
T=10Z+50抽样原理与抽样方法抽样原理抽样调查的特点和作用:
节省人力、物力;节省时间,提高效率;保证结果的准确性。
抽样的基本原则:
随机化原则。
保证样本对总体的代表性;可以对抽样误差的范围进行预测和控制。
抽样方法简单随机抽样分层随机抽样整群抽样(两阶段随机抽样)等距抽样(系统抽样)四个常用的理论分布正态分布、标准正态分布(Z分布)Z分布是平均数为0,标准差为1分布定义:
设X1,X2,,Xn为来自正态分布N(,)的一个样本,自由度n是相互独立的正态变量的个数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人力资源 应用 统计 心理 统计学 陈毅