人才测评的方法文档格式.docx
- 文档编号:22297348
- 上传时间:2023-02-03
- 格式:DOCX
- 页数:48
- 大小:62.78KB
人才测评的方法文档格式.docx
《人才测评的方法文档格式.docx》由会员分享,可在线阅读,更多相关《人才测评的方法文档格式.docx(48页珍藏版)》请在冰豆网上搜索。
3.个人创造力和开拓精神极强,做事极有主见,甚至独断专行。
4.思维高度活跃,只要动机受到启发,便可冒出出人意料或者异想天开的点子。
5.难以接受自上而下的权威,对于循规蹈矩的制度有着本能的反感,难以容忍现实中的不完美现象,行动经常充满矛盾等。
总之,所有的测评结果都说明:
此人不适合本公司文化,不是公司的理想员工。
这个案例告诉我们,对一个人直觉的评价往往具有主观性,在人才选拔中制定科学合理的测评标准,通过人才测评程序,会帮助人力资源主管选出适合该职位的优秀人才。
另外,对于像叶平这样具有很强业务能力的人,人力资源主管应该通过人才测评程序对其进行针对性的培训,使其人尽其才。
二、如何合理运用人才测评的三项关键技术
信度、效度和项目分析是人才测评的三项关键技术。
从信度、效度和项目分析三个维度评估人才测评,对于衡量人才测评结果的可靠性、有效性及人才测评测验题目的有效性具有重要的意义。
1.测量人才测评可靠性的信度
(1)信度的涵义及测量。
信度即可靠性,是指多次测评结果的一致性程度。
一个好的测量工具,对同一事物反复多次测量或由不同的人使用,其测量结果应该保持不变。
正如用一个体重计在一天内测量某人的体重,如果每次测量结果相差很大,即其测量的可靠性不高,也就是说这个体重计不是一个可靠的测量工具。
通过计算信度系数,可以衡量人才测评结果的可靠性。
信度系数通常由两个测量结果的相关系数来表示,即实得分数与真实分数相关的平方:
rxx=ST2/SX2
信度就是真实分数的方差在总体方差中所占的比例。
信度系数是一个介于0和1之间的数,信度系数越高表示可靠性越高。
其中:
rxx—信度系数;
Sr2—真实分数的方差;
Sx2—总体的方差。
(2)信度系数的作用。
信度系数的作用主要有两个:
①解释真实测评分数与实得分数的相关性。
信度可以解释为测量分数的变化中有多少是真正反映被测者分数变化的。
例如,当rxx=0.90时,意味着实得分数中有90%的方差是来自真实分数的差别,只有10%是来自测量的误差。
信度系数的分布是从0.00~1.00的正数范围,代表了从缺乏信度到完全可信的所有状况。
②说明可以接受的信度水准。
信度究竟多少才是可以接受的呢?
当然,最理想的情况是rxx=1.00,但实际上达不到。
这里我们给出几种类型的测评工具的信度系数,相信对于您的人才测评有指导意义。
一般能力与成就测评的信度系数在0.90以上,人格、兴趣等测评的信度系数通常在0.80~0.85之间。
详见下表:
几种心理测评的信度系数
测评类型信度
低中高
成就测评0.660.920.98
学术能力测评0.560.900.97
倾向性测评0.260.880.96
客观人格测评0.460.850.97
兴趣问卷0.420.840.93
态度量表0.470.790.98
一般来说,当rxx<
0.70时,不能用测评结果对个人做评价,也不能在团体间做比较;
当rxx>
0.70时,可用于团体间做比较;
0.85时,可用于对个人进行评价。
当然,信度是以测评所应用的情景为依据的,是某一特定条件下的一致性,因此,具体的测评一定要具体问题具体分析。
2.测量测评有效性的效度
(1)效度的涵义。
效度是指测评的有效性,即一个测验对被测评者准确测评的程度。
一个测验总是为一定的测评目的而设计编制的,并具有一定的操作规则和使用范围。
判断它的效度高低,首先要看它达到测评目的的程度,如果能正确地测评出所要测评的东西,那么它就是高效度的测量。
例如,用英文书写的算术题测量儿童算术能力,他的成绩不佳不能说明他的算术能力低。
因此,该测评作为能力测评便是无效的。
同理,智力测评只能用来度量智力,而不能用来度量个性,否则也是无效的。
(2)效度和信度的关系。
一般说,效度的作用比信度的作用更为重要。
如果一个测评效度很低,无论信度有多高,这项测评都没有应用价值。
效度是评价测评好坏、选择测评方法的重要标准之一。
通过对测评效度的分析,可以了解测评对所有测量的心理学变量的测量准确程度如何,以及对外在标准的预测能力。
(3)效度的测量。
效度是指与测评目标有关的真实分数方差与总分方差(指真实方差与误差之和)的比率。
3.测量问题好坏的项目分析
(1)项目分析的目的。
项目分析是指根据测试结果对组成测评的各个题目(项目)进行分析,从而评价测评题目好坏、对题目进行筛选的程序和方法。
进行项目分析有助于评价各个测评题目的好坏。
(2)项目分析的测量。
项目分析可以分为定性分析和定量分析,定性分析主要考虑内容效度,即题目表达的恰当性和有效性等方面;
而定量分析主要考察题目难度和鉴别度是否适当。
由于测评的信度、效度最终都依赖于题目的上述性质,所以通过项目分析,对测评题目进行选择和修改,还可以提高测评的信度和效度。
信度、效度和项目分析是人才测评的三项关键技术,三者的关系相辅相成,互相作用。
效度的作用比信度的作用更为重要,信度高不能保证效度一定高,但是效度高,信度一定高。
项目分析是基础的工作,通过项目分析,对测评题目进行选择和修改,可以提高测评的信度和效度。
三、如何进行信度评估
信度主要指测评结果的可靠性或一致性,是标准化人才测评的基本要求之一。
由于接受测评时被测评者的行为可能会由于各种原因而产生变动,偏离了其真实行为,这就会导致测评结果产生误差。
误差大,测评分数的可靠性就降低。
因此,对信度进行评估是十分重要的。
针对不同的误差来源,评估信度的方法主要有以下4种:
1.再测信度评估
(1)再测信度的适用情景。
再测信度所考察的误差来源是时间的变化所带来的随机影响。
如由天气、偶然的噪音或其他干扰,以及引起被测评者身心状态变化的因素,如疾病、疲劳、情绪波动、焦虑等原因造成的对测评结果的影响。
如感觉-运动测评或人格测评,比较适合用再测信度评估其可靠性。
再测信度代表测评成绩能够用于不同时间的程度,信度越高,受测评环境中日常的随机影响越小,测评就越稳定。
(2)进行再测信度评估需要注意以下三个问题:
①注意再测的间隔时间。
间隔时间太长或太短都会影响再测信度系数的高低。
再测间隔时间的长短,根据测评的性质和目的来确定。
如对于人格测评,再测时间在两周到6个月之间比较合适。
②再测信度一般只反映由随机因素导致的变化,而不反映被测评行为的长久变化。
例如,被测评者智力的发展与能力的提高,不是再测信度考虑的因素。
③不同行为受随机误差的影响不同。
如手指敏捷性就比言语理解力更容易受疲劳、环境等因素的影响。
因此,我们必须分析测评的目的和了解测评所预测的行为。
当测评行为或特质较为稳定时,再测信度的解释才有效。
(3)再测信度评估计算方法。
再测信度的高低用再测信度系数来表示。
最为简单的再测信度的计算方法为:
计算两次测评结果的积差相关系数。
其公式为:
N∑xy-∑x×
∑y
[N∑x2-(∑x)2]×
[N∑y2-(∑y)2]
N—两次测评结果数据配对总数(被测者个数);
x—被分析的测评结果(分数);
y—重复测评得到的测评结果(分数)。
r越接近于1则说明测评结果x越准确可靠,否则就说明测评结果越不准确,不可信。
2.复本信度评估
(1)复本信度的适用情景。
复本信度又称等值性系数,是以两个测评复本(功能等值但题目内容不同)来测评同一群体,然后求得在这两个测评上得分的相关系数。
复本信度的高低反映了这两个测评复本在内容上的等值性程度。
两个等值的测评互为复本。
计算复本信度的主要目的在于考察两个测评复本的题目取样或内容取样是否等值。
例如,同样是测评数学运算能力的测评,如果一个测评复本侧重于考核加减法的运算,另一个复本侧重于乘除法的运算,两者之间的相关性肯定不会很高,即复本信度低。
复本信度就是考虑这种内容取样误差的影响问题。
(2)复本信度的优点。
其优点在于:
①适用于在进行长期追踪或调查某些干涉变量对测评成绩的影响;
②减少了作弊的可能性。
(3)复本信度的缺点。
①如果测评的行为容易受练习的影响,则复本信度只能减少而不能消除这种影响。
②有些测评的性质会由于重复测评而发生改变,这样测评结果可靠性就不太高了。
③有些测评很难找到合适的复本。
(4)复本信度的评估计算方法。
复本信度的高低用等值系数来衡量。
等值系数的计算公式用下式计算:
N—测评结果的总个数(被测人数);
D—对应同一个被测两次评定等级(名次)的差,一般以被检验的测评结果为被减数。
3.内部一致性信度评估
(1)内部一致性信度评估的适用情景。
同质性是保证测评只测评单一特质的必要条件。
如果同质性差,则测评混淆了不同的内容,其结果就无从判断究竟是否反映了被测评者的特征。
例如在人格测评中,乐观情绪特质和外向特质是两个容易混淆的内容,这就要求测评设计时能找到相应的题目把二者区分开来。
在设计测评题目时,所有的测评题目都要保证只测评一种特质或内容,如果需要在一个测评中测评不同的内容,就应该将测评设计为几个分测评进行分别测评。
如16PF人格测评就是包括16个分测评,每个分测评量表只对一种人格特质进行测评。
(2)内部一致性信度评估计算方法。
α系数分析法是常用的内部一致性信度系数的计算方法,公式如下:
at=N×
St2-∑Vi2
n-1St2
n—测评项目数;
St2—测评结果的方差;
Vi2—每一项目的方差。
例如,某态度测评量表共5题,被测评者在各题上的得分的方差为0.80,0.81,0.79,0.78,0.82,测评总分的方差为15.00,因此α测评的系数为:
α=5(1-0.80+0.81+0.79+0.78+0.82)=0.92
5-115
4.评分一致性信度评估
(1)评分一致性信度评估的适用情景。
在有些测评中,评分者的评判也是误差的来源之一。
如投射法测评、创造力测评、无领导小组讨论、管理者情景模拟测评等等,都依赖于评分者的判断。
这种判断的主观性往往造成不同评分者的评分很不一致,因此,评分一致性信度评估就很有必要了。
(2)评分一致性信度评估的计算方法。
评分者信度的计算,通常是随机抽取若干份试卷,由至少两位受过训练的评分者按计分规则分别判分,然后计算他们的相关性。
几个评分者的评分越一致,评分者信度越高。
下面的公式反映了评分者一致性信度的度量,W越大说明测评结果越可靠。
W=[∑Ri2-(∑Ri)2]/1N2(m3-m)
mN
N—评定者人数;
m—测评项目个数;
Ri—第i项目上所有被测者等级之和或分数之和(这里分数只限于正整数)。
通过问卷等形式的人才测评结果是否可靠、准确呢?
再测信度、复本信度、内部一致性信度、评分一致性信度就是衡量测评结果可靠性的方法。
掌握、理解这些可操作性的评估信度的方法,对衡量测评结果的可靠性具有重要的意义。
四、如何进行效度评估
效度是评价测评好坏、选择测评的重要标准之一。
根据效度评估方法的不同,效度可以分为内容效度、构想效度和效标关联效度三类,下面是一些具体的评估方法。
1.内容效度评估
(1)内容效度评估的涵义。
内容效度是指测评题目对预测的内容或行为范围取样的适宜性程度。
例如,教师在讲课告一段落后要进行考试,而考题不可能包含讲过的所有内容,必须从中选出一个有代表性的题目样本,编制成测验,然后根据考试分数推断学生对该范围内知识技能的掌握情况。
如果测评题目不是该范围内的有代表性样本,或者过难或者过易,那么由此做出的推论,其效度必然很差。
因此,取样的恰当性就是影响测评效果的一个重要因素。
(2)内容效度的评估方法。
内容效度的确定一般没有可用的数量化指标,只能靠推理和判断来进行评估。
较好的内容效度依赖于以下两个条件:
①测评内容范围明确;
⒓测评内容的取样具有代表性。
因此,要保证良好的内容效度,应该从编制测评开始,谨慎选择合适的测评题目。
为了使内容效度的确定过程更为客观,可以采取如下步骤:
①确定总体范围,即描述有关的知识与技能及所用材料的来源;
②编制双向细目表,确定内容和技能各自所占的比例,并由测评编制者确定各题所测的是何种内容与技能;
③制定评定量表来测量测评的整个效度及其他特点,如测评包括的内容、技能、材料的重要程度、题目对内容的适用性等。
由每位评判者在评定量表上做出判断,总结获得测评内容效度的证据。
内容效度的确定还可采用经验的方法,例如,对成就测评可以检查不同年级的被测者总分和每题分数变化的情况。
(3)内容效度评估的应用。
内容效度最适合于评估教育和职业成就测评以及某些用于选拔和分类的人事测评。
内容效度评估旨在回答以下两个问题:
①该测评是否是应考察的某种技能和知识的代表性样本。
②测评的成绩是否不受无关因素的影响。
内容效度一般不适用于能力倾向测评和人格测评。
2.构想效度评估
构想效度表示一个测评是否达到了对某一理论概念或特质的测量。
所谓构想通常指一些抽象的、假设性的概念或特质,如智力、创造力、言语流畅性、焦虑等。
如果一个智力测评测得的结果与该测评所依据的智力理论或假设相符合,那么,我们说该测评具有较高的构想效度。
构想效度的确定通常需要综合评价各种不同的资料,一般采取两种途径:
一是考察与度量同类构想的测评是否相关;
二是考察是否与不应有关的东西无关。
例如,羞怯测评的分数应与一个人出现在聚会上的次数、团体中的发言多少以及父母和朋友的评价有关,而与度量其他构想的测评分数,如空间知觉、推论能力等基本无关。
3.效标关联效度评估
(1)效标关联效度的涵义。
效标关联效度又称预测效度,是指一个测评对处于特定情景中的个体的行为进行预测的有效性,也就是对我们所感兴趣的行为能够预测到什么程度。
在这里,被预测的行为是检验测评效度的标准,简称效标。
一个心理构想的外部行为表现可能很多,因此,用于检验测评的效标也很多,效标关联效度也就不止一个。
如果一个人在选拔消防员的测评上得分很低,而他在防止火灾和灭火中表现得与真正的消防队员一样好,那么,毫无疑问,这个测评不能用于消防员选拔,他的预测效度太低了。
(2)常用的效标。
效标是衡量测评有效性的参照标准,是一种可以直接、独立测量的行为。
即通过把效标行为转换为某种可以操作的测量指标,以便进行比较。
这种可操作的测量指标称为效标测量。
在测评的过程中,常用的效标有:
学术成就、特殊训练成绩、实际工作表现、团体对照和等级评定。
不同的效标用于不同的情况。
①学术成就效标属于对学术能力倾向测评的精确描述,常常作为某些多重能力倾向测评和人格测评的效标。
②特殊训练成绩效标常用于能力倾向测评中。
③实际工作表现这一效标常用于起选拔作用的一般智力测评、人格测评及能力倾向测评等。
如果一个测评是有效的,其必定是可靠的。
但反过来,一个测评具有很高的信度,则并不一定是有效的。
比如,如果我们使用一个指标偏高的秤测量体重,尽管每次测量都得到一致的结果,却并不能准确测出人的体重。
与信度相比,效度是一个更复杂、更重要的概念。
内容效度、构想效度和效标关联效度是效度的三种测评维度。
案例二:
普顿斯化学有限公司是一家跨国公司,以研制、生产、销售药品、农药等为主。
露秋公司是普顿斯化学有限公司在中国的子公司,主要生产、销售医疗药品。
随着生产业务的扩大,为了对生产部门的人力资源进行更为有效的管理、开发,他们希望在生产部建立一个处理人事事务的职位,工作主要是生产部与人力资源部的协调。
人力资源部经理王量对应聘者做了初步的筛选,留下了5人交由生产部经理李初再次进行筛选,李初对其进行选择,留下了两人,决定由生产部经理与人力资源部的经理两人协商决定人选。
这两个人的简历及具体情况如下:
赵安:
男,32岁,有企业管理硕士学位,有8年一般人事管理及生产经验,在此之前的两份工作均有良好的表现。
面谈结果:
可录用。
钱力:
男,32岁,有企业管理学士学位,有7年的人事管理和生产经验,以前曾在两个单位工作过,第一位主管评价很好,没有第二位主管的评价资料。
看过上述的资料和进行面谈后,生产部经理李初来到人力资源部经理室,与王量商谈何人可录用。
王量说:
“两位候选人,看来似乎都不错,您认为哪一位更适合呢?
”
李初说:
“两位候选人的资格审查都合格了,惟一存在的问题是,钱力的第二位主管给的资料太少,但是虽然如此,我也看不出他有什么不好的背景,您的意见呢?
王量说:
“很好,李经理,显然您和我对钱力的面谈表现都有很好的印象,人吗,有点圆滑,但我想我会容易与他共事,相信在以后的工作中不会出现大的问题。
“既然他将与您共事,当然由您做出决定更好,明天就可以通知他来工作。
于是,钱力被公司录用了,进入公司6个月以后,他的工作不如期望那样做得好,指定的工作,他经常不能按时完成,有时甚至表现出不胜任其工作的行为,所以引起了管理层的抱怨,显然,钱力对此职位不适合,必须加以处理。
(1)为什么会错选钱力?
该招聘选用的面谈的方式其效度和信度如何?
(2)如果您是人力资源部经理,您该如何处理这件事情?
以后应该如何避免?
参考答案:
1.管理人才测评可能的效标有:
智力能力、创造力、组织能力、沟通能力、心理承受能力等等。
2.
(1)人员招聘与录用,将随着企业组织的发展,在人力资源管理中占有越来越重要的地位,人员招聘与录用的成功与否将直接影响一个组织的兴衰成败。
对不同岗位的人员选聘,需要采取不同的方法,招聘人员应该具备公正的态度及相应知识和技能,设计科学合理的人员测评程序。
本案例中,首先,招聘人员的态度和相应知识的缺乏,导致招聘的失败。
其次,其选用的面谈方式效度和信度低,也是导致招聘失败的一个原因。
五、如何进行项目分析
项目分析是根据测评结果对组成测评的各个题目进行分析,从而评价题目的好坏、对题目进行筛选的程序和方法。
项目分析分为定性分析和定量分析,定性分析主要考虑内容效度,即题目表达的恰当性和有效性;
定量分析主要考察题目难度和鉴别度是否适度,即测评题目的难易程度。
测评信度、效度最终都依赖于题目表达的恰当性、有效性及难易程度等特性,因此,通过项目分析,对测评题目进行选择和修改,可以提高测评的信度和效度。
下面对难度分析和测量项目的鉴别度分析的评估进行详细描述:
1.测评的难度分析评估
难度分析评估主要指测评题目难度水平的测定。
测评题目难度水平究竟多高合适,这依赖于测评的目的、性质和题目的形式。
(1)从测评的目的考虑。
许多测评都希望能准确测评个体间的差异。
如果在某题上,被测评者全答对或全答错,则该题无法提供个别差异的信息,即不能把不同的被测评者区别开来。
题目难度(即答对或通过该题的人数百分比)越接近于0或者1,越无法区分被测评者之间能力的差异。
题目难度越接近0.5,区别力越高。
因此,设计测评题目时,尽量选择难度在0.5左右的试题比较合适。
(2)从测评的作用考虑。
对于选拔用的人才测评,应该尽量使题目难度值接近录取率。
比如,测评若是要辨别或选择少量的最优秀的应试者,那么,测评应该有较高的难度,即题目难度值要小。
反之,题目难度值要高。
(3)从题目的形式考虑。
一般地,对于选择题,其题目难度以0.5最为合适;
对于是非题而言,其难度值以0.75最为合适;
对于四选一题目,其难度值约为0.63最合适。
2.测评项目的鉴别度分析评估
项目鉴别度是指测评项目对于所检查的心理特性的鉴别能力和区分程度。
一般情况下,只要鉴别度值大于0.30时,题目就可以接受了。
美国测评专家L.Ebel提出了鉴别度指数的大致标准可以为我们的实际工作提供参考。
鉴别度指数标准
鉴别度指数D试题评价
0.4以上0.30~0.390.20~0.290.19以下很好良好,最好修改可以,必须修改差,必须淘汰
项目分析可以提高测评的信度和效度。
因此,进行项目分析具有重要的意义,确定难度分析值和鉴别度指数则从定量的角度帮助我们衡量题目的好坏和难易程度。
六、如何编制人才测评标准
人才测评标准的编制关系到人才测评的科学性、有效性。
人才测评标准多数采用量表和评语定量化的形式。
针对不同的情况,在不同的时期,可以采取不同的编制方法:
1.评语式标准的编制
(1)评语式标准的适用情景。
评语式标准就是用文字评述每个要素的不同等级,这是人才测评中运用较广、形式较多的一种标准。
(2)评语式标准实例。
下表是某企业编制的管理人才评语式标准的实例。
某企业管理人才评语式标准实例
结构要素测评标准
素质结构责任心坚持以责任
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人才 测评 方法