还剩13页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
精品行业资料,仅供参考,需要可下载并修改后使用!第五章心理测量学知识第一节概述第一单元测量与测量量表一测量测量就是依据一定的法则用数字对事物加以确定该定义包括三个元素,即事物、数字和法则事物指测量的对象;数字是代表某一事物或该是我某一属性的量数字具有区分性、序列性、等距性和可加性法则,是测量所依据的规则和方法
二、测量要素任何测量都应具备两个要素,即参照点和单位㈠参照点是确定事物的量必须有一个计算的起点,这个起点叫作参照点参照点不同,测量的结果便无法相互比较参照点有两种一是绝对零点,表示“无”,如测量轻重程度等都是以零点为参照点二是人为确定的参照点,即相对零点如海拔高度理想的参照点是绝对零点,但在心理测量中很难找到绝对零点,多采用人为标定的测量零点㈡单位单位是测量的基本要素,没有单位就没法进行测量好的单位必须具备两个条件一是确定的意义,即对同一个单位,所有人的理解意义要相同,不能出现不同的理解;二是有相同的价值,即相邻两个单位点之间的差别总是相等的心理测量的单位不够完善,既无统一的单位,也不符合等距的要求
三、测量量表测量的本质是根据某一法则在一个定有单位和参照点的连续物体把事物的该属性表现出来,这个连续体称为量表根据量表的精确程度,斯蒂文斯将量表中低级到高级分成四种水平,即命名量表、顺序量表、等距量表和等比量表心理测量是在顺序量表上进行的,不过利用某种统计方法,可以把顺序量表得到的数据换算为等距数据来进行统计第二单元心理测量的基本概念
一、心理测量的定义所谓心理测验,就是依据心理学理论使用一定的操作程序,通过观察人的少数有代表性的行为,对贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段
二、心理测量的性质心理测量具有间接性(无法直接测量)、相对性(没有绝对标准,只是相对于常模)、客观性(标准化)第三单元心理测量的分类一测验分数的受挫做其效标分数分布的标准差,即预测误差大小的估计值
二、预测效标分数
三、预测效标指数第四单元影响效度的因素
一、测验本身的因素
①测验材料必须对整个内容具有代表性
②测验设计时应尽量避免容易引起误差的题型
③测验难度适中,具有较高的区分度
④测验长度要适当,要有一定的测题量
⑤错题的排列按先易后难的顺序排列
二、测验实施中的干扰因素㈠注册者的影响因素:是否遵从测验使用手册的各项规定标准化实施;指导语是否统一正确;测验的时限是否一致;评分是否合理对于效标效度,测验与效标两者实施时间间隔时间越长,测验与效标越容易受到很多随机因素的影响,因此所求的相关必然性很低测验情境也会影响到测验的效度㈡受测者的影响因素受测者在测验时的兴趣、动机、情绪、态度和身心健康状况,都会影响受测者在测验情境中的反应反应定式也会降低测验的效度
三、样本团体的性质㈠让本团体的异质性与信度系数一样,如果其他条件相同,样本团体越同质,分数分布范围越小,测验效度就越低样本团体越异质,分数分布范围就越大,测验小杜就越高
①至于选拔的受测者团体参加效度研究,降低了测验的效度
②选拔标准太高,让本团体的同质性增加,降低了测验的效度㈡干涉变量对于不同性质的团体,同一测验的效度会有很大的不同这些性质包括年龄、性别、教育水平、智力、动机、兴趣、职业和任何其他有关的特征由于这些特征的影响,使得测验对于不同的团体具有不同的预测能力,故测量学上称这些特征为干涉变量
四、效标的性质效标效度是以测验分数与效标测量的相关系数来表示的,因此效标的性质如何,在评价测验的效度时是值得考虑的效标测量本身的可靠性即效标测量的信度,就是值得考虑的一个问题如果效标测量的信度不可靠,它与测量分数之间的关系也就失去了可靠性第五节项目分析测验的项目分析包括定性分析和定量分析两个方面定性分析包括考虑内容效度、题目编写的恰当性和有效性高定量分析主要指对题目难度和区分度等进行分析通过项目分析,我们可以选择和修改测验题目,以提高测验的信度和效度第一单元项目的难度难度是指项目的难易程度在能力测验中通常需要一个反映难度水平的指标,在非能力测验中,类似的指标是“通俗性”难度的指标通常以通过率表示,记忆答对或通过该区的人数百分比来表示P=R/NxlOO%P代表项目的难度,N为全体受测者人数,R为回答对或通过该项目的人数以通过率表示难度时通过的人数越多(即P值越大),难度越低;通过的人数越少(即P值越小),难度越高也有人将受测者未通过的每个项目的人数百分比作为难度的指标(P通过率与项目难度大小成反比)
二、计算方法㈠二分法几分的项目P=(Ph+Pl)-2其中p代表难度,Ph和P1分别代表高分组合低分组通过率当受测者人数较多时,可根据测验中成绩将受测者分成三组分数最高的27%受测者为高分组(NH);分数最低的27%受测者为低分组(NL);中间46%的受测者为中间组分别计算高分组合地分组的通过率,乙两组通过率的平均值作为每题的难度㈡非二分积分的项目当测验项目为问答题或不能用二分法计分的形式时,一般用下面的公式计算难度P=X(上面有一杠)^XmaxxlOO%X(上面有一杠)为全体受测者在该题目上的平均分,Xmax为该题的满分
三、难度水平的确定㈠项目的难度项目难度的大小取决于测验的目的性质以及项目的形式P值越接近于O.5O区别力越高对于是非题而言,进难度值应该为
0.275最为合适对于四选一的题目,其难度之约为
0.63最为合适㈡测验的难度如果受测者样本具有代表性,对于中等难度的测验,其测验总分应该接近于常态分布如果所获得的分数分布不是常态的,得分多数偏高或偏低,则为偏态分布偏态分布又有“正偏态分布”和“负偏态分布”两种正偏态分布,极大多数得分集中在低端,说明编制的测验对于所要研究的样本团体来说偏难,因此必须增加足够数量的较容易的项目;负偏态分布,极大多数得分集中在高端,说明测验过易,必须增加足够数量的有效高难度的项目一般来说最好使测验中所包含的题目的难度在
0.50±
0.20之间,平均难度接近
0.50o第二单元项目的区分度项目区分度也叫鉴别力,试纸测验项目对受测者的心理特性的区分能力如果一个项目实际水平高的受测者能顺利通过,而实际水平低的受测者不能通过,那么我们就可以认为该项目有较高的区分度
二、计算方法㈠鉴别指数
①按测验中分的高低排列答卷
②确定高分组与低分组,每一组去打军总数的27%o
③分别计算高峰祝玉帝分组在该项目上的通过率或得分率
④按下面公式估计出象的鉴别指数D=Ph-Pl(D为鉴别指数,Ph为高分组在该项目上的通过率或得分率,P1为低分主在该项目上的通过率或得分率)D越大说明该项目区分两种不同水平的程度越高若D0,则反映高水平组在该项目中的得分率低于第一水平组,说明项目有问题㈡相关法计算区分度最常用的方法是相关法,基于某一项目分数与效标成绩或测验总分的相关作为该项目区分度的指标相关越高表明项目越具有区分的功能区分度去值范围介于-1到+1之间
三、区分度与难度的关系难度和区分度都是相对的,是针对一定团体而言的,绝对的难度和区分度是不存在的第六节测验编制的一般程序
一、测验对象在编制测验前,首先要明确测量对象,也就是该测验编程后要用于哪些团体,只有对受测者的年龄、文化程度、社会经济状况以及阅读水平都做到心中有数,编制测验时才能有的放矢
二、测验的用途测验的用途可分两类即显性和预测,我们将心理测验分为显性测验也和预测性测验
三、测验的目标测验的目标已出现不同而已一般分为三种情况
1.工作分析;
2.对特定概念下定义;
3.确定测验的具体内容第二单元错题的编写
一、搜集资料题目的来源和分为三个部分
1.已出版的标准测验;
2.理论和专家的经验;
3.临床观察和记录
二、命题原则
1.内容方面,要求题目的内容符合测验的口的,避免贪多而乱出题其次内容取样要有代表性,符合抽验计划的内容,比例适当最后题目之间的内容要相互独立,互不牵连,切记一个题目的答案影响对另一个替补的回答㈡文字方面使用准确的当代语言,避免使用生僻的字词句或词汇语句要简明扼要,即排除与答案无关的因素,又不要遗漏答题所依据的必要条件最好是一句话说明一个概念,不要使用两个或两个以上的关键,意义须明确,不得暧昧与含糊,尽量少使用双重否定句㈢理解方面题目应有确切的答案,题目的内容不要超出受挫团体的知识水平和理解能力;题目不可令人费解,更不能有歧义㈣社会敏感性方面编制测题时,应尽量避开社会敏感性问题,涉及社会禁忌或个人隐私的题目尽量不用菲力普关于涉及社会经济和个人隐私的题目的编写策略
1.命题时假定受挫折具有某种行为使他不得不在确定没有该行为时才否定可避免否定答案过多的倾向
2.命题是假定范围不一致
3.指出该行为虽然是违规的,但是却是常见的
三、编写要领对心理测验的题目进行分类的标准很多,常见的可以分为两大类提供型和选择型提供性题目要求受测者给出正确答案,如论文题、简答题、填充题等;选择性题目要求受测者在有限的几个答案中选择正确的答案,如选择题、是否题、匹配题等对选择题我们即要编写好题干,也要编好选项,有如下六点必须注意
①题干所提问题必须明确,
②选项切忌冗长
③每道题只给一个正确答案,其他属诱答
④各选项长度应相当,尽量不要有长有短
⑤避免提干用词语选效用是一致,否则成了选择答案的线索选项中应避免出现“绝不,“从来”、“所有”、“唯一”、绝对”等词
⑥选项最好用同一形式选项最好随机排列简答题编写的三条原则
①最好采用问句形式;
②最好是填充形式,空格不易太多,并且所空出的应该是关键词,并将空格去掉放在最后
③每道题应只有一个正确答案,而且答案要简短而具体对不完整的答案,应事先规定评分标准第三单元测验的编排和组织在选择题目形式是需要考虑如下三点
①测验的目的和材料的性质;
②接受测验的团体的特点,如幼儿用口头测验,文盲不识字不多的人宜采用读和写的项目或操作项目
③各种实际因素,如受测人数、测试时间、所需设备等常见的测题排列方式L并列直进式;
2.混合螺旋式第七节心理测验的使用一个测量工具无论制作多么精良,如果不按正确的方法使用,别不能很好的发挥其效用第一单元主测者的资格(略)第二单元测验的选择
一、所选测验必须适合测量的目的
二、所选测验必须符合心理测量学的要求第三单元测验前的准备及注意事项
一、测验前的四项准备工作
1.预告测验,事先应当通知受测者,保证受测者确切知道测验的时间、地点,以及内容范围、测题的类型等,使受测者有一定的准备,及时调整自己的情绪和状态,一般不搞突然袭击
2.准备测验材料无论是个别测验还是团体测验,必须在测验前清点、检查和摆放好测验材料,以免忙中出错
3.熟悉测验指导语主测者记住指导语是最基本的要求宣读指导语要使受测者在测验中感到自然轻松,否则会影响测验分数
4.熟悉测验的基本程序
二、测验中主测者的职责(略)
三、建立协调关系协调关系指的是主测者和受测者之间一种友好、合作、能促使受测者最大限度地做好测验的一种关系测验对象不同,建立协调关系的步骤也应有所不同测验学前儿童时,应以友好愉快轻松的自然态度与儿童交流,测验时应该更加灵活有趣像做游戏一样引起孩子的兴趣测验学生时,则应通过竞争来激发测验动机对于成人,应强调测验的目的,强调测验对他们有利的方面,才能激发他们的能力第四单元测验实施的程序及要素
一、指导语㈠对受测者的指导语指导语一般有如下内容组成1•如何选择反映形式(画W”、口答、书写等);
2.如何记录这些反应(答卷纸、录音、录像等);
3.时间限制;
4.如果不能确定正确反应时该如何操作;
5.例题;
6.有时告知受测者测验目的㈡对主测者的指导语
二、时限,在最高行为测验中,速度是需要考虑的重要因素之
一三、测验的环境条件第五单元受测者误差及控制方法
一、应试技巧与练习效应㈠应试技巧受测者的测验经验、应试技巧或对测验程序的熟悉程度都会影响测验成绩他们能觉察出正确答案与错误答案的细小差别,懂得合理分配测验时间,而且常常是各种题型都见过,多数情况下会比与他们能力相当但缺乏测验经验的受测者获得更高的分数㈡练习效应在涉及个体认知功能的测验上,任何一个测验在第二次应用或重复测验时,都会有练习效应而使测验成绩提高具体表现为
1.教育背景较差、经验较少或智力较高者,受练习效应的影响较大
2.着重速度的测验,练习效应较为明显
3.重复实施相同的测验,受练习效应影响的程度要大于复本的测验
4.两次测验之间的时距越大,练习效用越小,相距三个月以上的练习效应可以忽略不计
5.一般的平均练习效应约占1/5个标准差一下,并且仅限于第一次及第二次重测,第三次以后得练习效应增加不明显
二、动机与焦虑因素㈠应试动机在测量成就智力和能力倾向等变量时,只有受测者的动机强烈,才能尽力争取好成绩动机效应在测量态度、兴趣及人格等典型行为表现时也有影响(想给一个好的印象,或故意给人以坏的影响)㈡测验焦虑焦虑测验成绩的影响为倒u型曲线适度的焦虑会使人的兴奋性提高,注意力增加,提高反应速度,从而提高智力测验、成就测验和能力倾向测验的成绩但过高的焦虑也会使工作效率降低,注意力分散,思维变得狭隘、刻板,记忆中储存的东西抽取不出而一点焦虑也没有,受挫则满不在乎的态度会是测验成绩降低测验焦虑会受到下列五个因素的影响
1.能力高的人测验焦虑一般较低,而对自己能力没有把握的人,测验焦虑较高
2.抱负水平过高,求胜心切的人,测验焦虑较高
3.具有某种人格特点,如缺乏自信,患得患失,情绪不稳定的人容易产生侧是焦虑
4.测验成绩与受测者的关系重大,或受测者受到的压力过大容易使其产生测验焦虑
5.经常接受测验的人焦虑较低,而对测验程序不熟悉,尤其是测验中采取了新的题目形式或实施程序,会增加测验焦虑
三、反应定势反应定式也叫反应风格,是指独立于测验内容的反应倾向,即由于每个人回答问题的习惯不同,而是能以相同的受测者得到不同的测验分数㈠求“快”与求“精确”的反应定势为了避免这两种定式的出现,除非“反应速度”本身极为重要的研究目标,否则应让受测者有充分的时间反应,同时应该注明每道题的答题时间,以减少求“快”与求“精确”的反应定势的影响㈡喜好正面叙述的反应定势大量研究发现,受测者在无法确定是非题的正确答案时,选择“是”的人往往多于选择“否”的人,或者说选“是”的人多于实际上应该选“是”的人,表现为喜好正面叙述的反应定势,也叫“肯定定式”有趣的是,有些编制者在编制是非题时也有“是”多于“否”的倾向所以,在编制是非题时,“是”与“否”题大致相等或答“否的题略多,是控制肯定定势的有效方法㈢喜好特殊位置的反应定势在完成测验的过程中,受测者如果完全不知道选择题的正确答案,这不会以完全随机的方式来决定该选哪一个选项,而是有特别喜好选择某一位置的答题倾向有些测验编制者也存在喜好某个位置的反应定势在测验编制过程中,正确答案的位置在整个测验中出现在各个位置的概率相等,可以控制这种位置定式㈣喜好较长选项的反应定势㈤猜测的反应定势,对不会做的题有的人敢于猜测,有的人却不愿猜测,猜测行为对测验分数会有影响敢于猜测的受测者将比谨慎的受测者更容易得高分第六单元测验的评分
一、原始分数的获得为的是评分尽可能的客观有如下三点要求
1.及时而清楚地记录反映情况
2.要有记分键选择题的记分键包括每一道题正确反映的号码或字母;问答题的记分键包括一系列正确的答案或允许的变化;论述题的记分键包括各种可能接受答案的要点;投射测验不可能有明确而统一的答案,记分键上指明的的是具有或缺少某种人格特征的典型反映
3.将受测者的反应和记分键比较,对反映进行分类
二、原始分数的转换经过处理和对照参照标准得来的分数就是导出分数发展分数百分位数标准分数等都是导出分数常模表为测验使用者提供了一种方便易行的由原始分数向导出分数转化的方法第七单元测验结果的报告
一、测验分数的综合分析L应根据心理测验的特点进行分析,通常是用测得的IQ值加减5(85%〜90%的可信限水平)
2.不能把分数绝对化,更不能仅仅根据一次测验的结果轻易下结论
3.为了对测验分数作出确切的解释,只有超模资料是不够的,还必须有测验的信度和效度资料
4.对于来自不同测验的分数不能直接加以比较
二、报告分数的具体建议(七个问题)L应告知对于测验分数的解释,并非仅仅报告册分数
3.要避免使用专业术语
4.要保证当事人知道这个测验测量或预测什么
5.要使当事人知道他是和什么团体进行比较
6.要使当事人知道如何运用他的分数
7.要考虑测验分数将给当事人带来怎样的心理影响
8.要让当事人积极参与测验分数的解释
一、按测验的功能分类
1.智力测验(一般能力测验);2•特殊能力测验;
3.人格测验
二、按测验材料的性质分类
1.文字测验(缺容易受受挫折文化程度的影响);
2.操作测验(优不受文化因素的限制缺不以团体施测,时间上不经济)
三、按测验材料的严谨程度分类L客观测验;
2.投射测验
四、按测验的方式分类
1.个别测验;
2.团队测验
五、按测验的要求分类
1.最高行为测验(要求受测者尽可能作出最好的回答,如智力测验)
2.典型行为测验(按通常的习惯方式作出反应,没有正确答案,如人格测验)第四单元纠正错误的测验观
一、错误的测验观L测验万能论
3.测验无用论
4.心理测验即智力测验
二、正确的测量观L心理测验是重要的心理学研究方法之一,是决策的辅助工具
2.心理测验作为研究方法和研究工具尚不完善(心理测验的最大问题是理论基础不够坚实)第五单元心理测验在心理咨询中的应用我国的心理门诊中运用较多的大致有三类心理测验,即智力测验、人格测验以及心理评定量表
一、智力测验包括中国比内量表、韦氏成人智力量表(WAIA-RC)、韦氏儿童智力量表(C-WISC)、韦氏幼儿智能量表、瑞文标准型测验(SPM)、联合型瑞文测验(CRT)
二、人格测验埃里克森人格问卷(EPQ)、卡特尔16种人格因素问卷(16PF)、明尼苏达多项人格测验(MMPI)
三、心理评定量表精神病评定量表、躁狂状态评定量表、抑郁量表、焦虑量表、恐怖量表等第六单元心理测量的发展史隋唐时的科举取土制度是世界上最早的心理测量的实践高度为心理测量奠定了统计学的基础1890年卡特尔在《心理》杂志上发表了“心理测量与测量”一文,这是心理测验第一次出现于心理学文献中1904年比内和西蒙奠定了第一个心理量表——比纳量表纵观心理测量的发展,人们常说19世纪80年代是高尔顿的十年(高尔顿喊口号);90年代是卡特尔的十年(卡特尔写文章);20世纪头十年都是比内的智力测验的十年(比内编量表)团体测验始于第一次世界大战,在推孟的研究生奥蒂斯人格测验的先驱是克雷丕林,他最早将自由联想测验实测于精神病人1920年问世的罗夏测验这是投射测验的发端我国的心理学家正在致力于心理测验的本土化第二节测验的常模第一单元常模团体
一、常模团体的性质常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本
二、常模团体的条件㈠群体的构成必须明确界定㈡常模团体必须是所测群体的代表性样本㈢样本的大小要适当(如果总体数目小,只有几十个人,这需要100%的样本;如果总体数目大,一般最低不小于30或100个;全国性常模,一般应有2000〜3000人为宜)㈣标准化一样组是一定时空的产物
三、取样的方法㈠简单随机取样㈡系统抽样(又称等距抽样,就是将已编好号码的个体排成顺序,然后每隔若干个号码抽取一个系统抽样要求目标总体无等级结构存在,如果发现排列有某种内部循环规律存在,就不能用这种抽样方法)㈢分组抽样有时总体数目较大,无法进行编号,而且群体又有多样性,这时可以先将群体进行分组,再在组内进行随机取样这就叫分组抽样㈣分层抽样在确定长模时,最常用的是分层抽样的方法它是先将目标总体按某种变量(如年龄)分成若干层次,在从各层次中随机抽取若干受测者,之后把各层的受测者组合成常模样本使用分层抽样方法获得的常模在解释测量分数时更为有效分层抽样可以分为两种方法,即分层比例抽样和分层非比例抽样
四、常模与常模分数㈠常模常模是一种供比较的标准量数,由标准化样本测量结果计算而来,它是心理测量是用于比较和解释测验结果的参照分数标准根据样本的大小和来源,通常有全国常模、区域常模和特殊常模根据具体应用标准和分数特征,则有百分位常模和标准分常模等㈡常模分数常模分数就是施测常模样本后,将受挫折的原始分数按一定规律转化出来的导出分数原始分数是通过将受挫折的反应与标准答案相比较而直接获得的测试分数本身没有多大意义,必须转化为导出分数导出分数具有一定的参照点和单位,它实际上是一个有意义的测量量表,它与原始分数等值,可以进行比较从原始分数转化为导出分数时,既要根据原始分数的分布特点,又要按照现在统计方法的基本原理,才能转换处等单位、带参照点的有意义的导出分数第二单元常模的类型
一、发展常模人有许多心理特质,如智力、技能等,是随时间以有规律的方式发展的,所以可将个人的成绩与各种发展水平的人的平均表现相比较根据这种平均表现所制成的量表就是发展常模,也叫年龄量表在此量表中,个人的分数指出他的行为在按正常途径发展方面处于什么样的发展水平㈠发展顺序量表最直观的发展常模是发展顺序量表,它告诉人们多大的儿童具备什么能力或行为就表明其发育正常相应能力或行为早于某年龄出现说明发育超前;否则即为发育滞后㈡智力年龄为每个年龄水平都编织一些适当的题目,便可以得到一个评价儿童智力发展水平的年龄量表一个儿童在年龄列表上所得的分数,就是最能表达代表他的智力水平的年龄,这个分数叫做智力年龄,简称智龄智龄是年龄量表上衡量智力的单位求智龄的方法很简单,只要将儿童在车辆上都分属于各年级组的一般儿童比较,便可以给予一个年龄分数但在实际中,有些受测者在某个低年龄水平的题目少失败,但通过了更高年龄水平的题目,因此在计算中先算出基本年龄,即全部题目都通过的那组题目所代表的年龄在所有更高年龄水平上通过的题目,用月份计算,加在基础年龄上也就是说儿童的智龄是基础年龄于在较高年龄水平的题目上获得的附加月份之和例如在中国比内西蒙量表中,智龄=基础年龄(全部通过的那个级别)+超出题目得分x2(月)一个人的智龄并不一定和他的实际年龄相符,聪明的儿童其智龄高于实际年龄,愚笨的好儿童其智龄小于实际年龄,只有普通儿童其智龄与实际年龄相近似㈢年级当量延期到六号实际上就是年级量表,说明测验结果输哪一年级的水平,在教育成就策略眼中最常用年级当量的单位通常为10个月,10个月为一个年级,这种做法是假设在一个学年中两个月的假期在所测量目标的发展上是不重要的
二、百分位常模百分位超模包括百分等级和百分点、四分位数和十分位数㈠百分等级百分等级是应用最广的表示测验分数的方法,你的测验分数的百分等级是指在常模样本中低于这个分数的人数百分比百分等级指出的是个体在常模团体中所处的位置,百分等级越低,固体所处的位置就越低㈡百分点百分点也称百分位数,与百分等级的计算方法不同,百分等级是计算低于某测试分数的人数百分比,而百分点则是计算处于某100分比例的人对应的测验分数是多少在分数量表中,对应于某100分等级的分数点就叫做百分点和百分位数在实际应用中,我们一般既可以由原始分数计算百分等级,也可以由百分等级确定原始分数通过这样的双向方式编制的原始分属于百分等级对照表就是百分位常模㈢四分位数和十分位数四分位数和十分位数是百分位数的两个便是,其含义相似,四分位数是将量表分成四等份,相当于百分等级的25%、50%和75%对应的三个百分点分成的四段十分位分数是将量表分成十等份
三、标准分常模标准分成模式将原始分数与平均数的距离一标准差为单位表示出来的量表因为它的基本单位是标准差,所以叫标准分数㈠线性转换的标准分数Z分数为最典型的线性转换的标准分数常见的标准分数有T分数(平均数为50,标准差为10)、标准九分(平均数为5,标准差为2)、标准十分(平均数为
5.5,标准差为
1.5)、标准二十分(平均分为10,标准差为3)、离差智商(平均分为100,标准差一般为15)㈡非线性转换的标准分数当原始分数不是常态分布时,也可以通过非线性转换使之常态化常态化过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的标准分数
四、智商及其意义㈠比率智商比内-西蒙量表传入美国后,斯坦福大学推孟教授于1916年对其修订成为斯坦福比奈量表他在心理年龄的基础上,以智商表示测验结果,即比率智商比率智商并不适合于年龄较大的受测者㈡离差智商离差智商是一种以年龄作为样本计算而得出的标准分数,为使其与传统的比率智商基本一致,韦克勒斯将离差智商的平均数定为100,标准差定位15o所以离差智商建立在统计学的基础上,它表示的是个体智力的年龄组中所处的位置,婴儿时表示智力高低的一种理想的指标第三单元常模分数的表示方法
一、转换表法最简单最基本的表示常模的方法就是转换表法,也叫常模表
二、剖面图法剖面图法是将测验分数的转换关系用图形表示出来,更加直观第三节测验的信度第一单元信度的概念
一、信度的定义信度是指同一受测者在不同时间内用同一测验(或用另一套相当的测验)重复测量,所得的结果的一致程度信度之首随机误差的影响系统误差产生恒定效应,不影响信度
二、信度的指标信度的指标常见的有两大类共三种表示方法㈠信度系数与信度指数(心动指数的平方就是新度系数)㈡测量标准(测量的标准误与信度之间有互为消长的关系,信度越高标准吴误越小,信度越低标准误越大)第二单元信度评估的方法
一、重测信度(又叫稳定性信度)它是采用重测法,即使用同一测试,在同样条件下,对同一组受测者前后施测两次,求两次得分间的相关系数用重测法估计信度的优点在于能够提供有关测试是否随时间而变化的材料,可作为受测者将来行为表现的依据其缺点是一首练习和记忆的影响两次测试的时间一般是两周或四周较宜,间隔时间最好不超过六个月
二、复本信度(也叫等值性系数)他是一两个等值但题目不同的测试来测量同一群体,然后求得受测者在两个测试上得分的相关系数,这个系数就代表的复本信度的高低复本信度反映的是测验在内容上的等值性,故又称等值性系数优点是能够避免重测信度的记忆效果学习效应等问题缺点是
①如果测试的行为易受练习的影响,复本信度只能减少而不能完全消除这种影响
②由于第二次测验只是改变了题目的内容,已经掌握的解题原则,可以很容易地迁移到同类问题上去,所以学习的效用不能完全消除
③对许多测验来说建立副本十分困难
三、内部一致性信度内部一致性信度主要反映的是题目之间的关系,表示错也能测量相同内容或特质的程度㈠分半信度分半信度值采用分半法评估所得的信度系数通常在测验实施后将测验按项目编号的奇数和偶数分为等值的两半,并分别计算每位受测者在两半测验上的得分,求出这两本分数的相关系数,这个相关系数就代表了两半测验内容取向的一致程度,因而属于内部一致性信度系数分办法经常会低估信度,必须通过一些公事去加以修正,借以估计整个测验的信度(斯皮尔曼-布朗公式)㈡同质性信度同质性主要代表测验内部所有题目间的一致性
四、评分者信度一般要求在成堆的受过训练的评分者之间平均一致性达到
0.90以上第三单元信度与测验分数的解释信度可以接受的水平一般的能力测验和成就测验的信度系数都在
0.90以上,有的可以达到
0.95o而人格测验兴趣态度价值观等测验的信度一般在
0.80〜
0.85或更高些一般原则是:信度系数V
0.70时,测验不能使用当信度系数在
0.70和
0.85之间时,可以用于团体比较当信度系数大于
0.85时,才能用来鉴别和预测个人成绩或作为新编的测验信度都应高于原有的同类测验或相似测验第四单元影响信度的因素㈠样本特征
1.样本团体异质性的影响;
2.样本团体平均能力水平的影响㈡测验长度
1.测验越长,测验的测题取样或内容取样就越有代表性
2.测验越长,受测者的猜测因素影响就越小但增加测线长度的效果应遵循报酬递减律原则,虽然过程是得不偿失的,有时反而会引起受测者的疲劳和反感而降低可靠性
三、测验难度测验难度对信度的影响质存在于某些测验中,如智力测验成就测验能力倾向测验等,对人格测验兴趣测验态度量表懂不存在难度问题,因为这些测验的题目答案没有正确和错误之分难度与信度之间的并没有简单的对应关系
四、时间间隔时间间隔只对重测信度和不同时测量时的复本信度(重测复本信度)有影响,其他的信徒来说不存在时间间隔问题以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越久,其他变因介入的可能性越大,受外界的影响也越大,信度系数越低第四节测验的效度第一单元效度的概念
一、效度的定义效度是指所测量的与所要测量的心理特点之间的符合程度简单地说就是指一个心理测验的准确性测量的效度除受随机误差影响外还受系统误差的影响可信的测验未必有效,有效的测验必定可信
二、效度的性质㈠相对性任何测验的效度是指对一定的目标来说的,或者说测验只有用于与测验目标一致的目的和场合才会有效世上没有一种对所有目的都有效测验,也没有一个测验编制者能把所有的心理特征都包含在他的一套测验之中所以评测测验的效度时,必须考虑其目的与功能㈡连续性测验效度通常用相关系数表示,他只有程度上的不同,我们不能简单的说“有效”或“无效”,应该用效度较高或较低来评价另外效度是针对测验结果的测验的有效性是针对测验结果而言的,即测验效度是“测验结果”的有效性程度信度是效度的必要而非充分条件,效度授信度制约第二单元效度评估的方法美国心理学会在1974年发行的《教育与心理测量值标准》一书中将效度分为三大类内容效度、构想效度和效标效度
一、内容效度内容效度指的是测量题目对有关内容或行为取样的适用性,即该测验是否是所预测量的行为领域的代表性取样由于这种测验的效度主要与测验内容有关,所以称为内容效度想要编制有较高内容效度的心理测验,首先要对所测验的心理特征有一个明确的概念,并划定出哪些行为与这种心理特征密切相关;其次测验题目应是所界定的内容范围的代表性取样要求内容效度的测验,并不一定要求测验为同质的只有当测验用来测量某一心理特质时,高度的同质性才是需要的㈡内容效度的评估方法
1.专家判断法(逻辑角度)
①定义好测试内容的总体范围,描述有关的知识与技能及所用材料的来源;
②编制双向细目表,确定内容和技能各自所占的比例,并由测验编制者确定各其所测的是何种内容与技能;
③制定评定量表来测量测验的整个效度
2.统计分析法内容效度可由一组受测者在独立取自同样内容范围的两个测验复本中得分之相关来做评估再测法也可用于内容效度的评估
3.经验推演法这种效度都是通过实践来检验效度㈢内容效度特性内容效度经常与表面效度混肴,表面效度是由外行对测验做表面上的检查确定的,它不反映出现实际测量的东西,只是值检验表面上看来好像是检验所要做的东西而内容效度是有够资格的判断者作出详尽地、系统地对测验作评价而建立的最高行为检测要求有较高的表面效度,以是受测者有较强的动机,尽最大努力去完成典型行为测验去要求较低的表面效度,只有当受测者不知每个题目测量什么的时候,才会按自己的典型方式真实作答
二、构想效度也叫构思角度或结构角度,主要涉及的是心理学的理论概念问题,是指测验能够测量到理论上的构想或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何㈡构想效度的估计方法
1.对测验本身的分析测验内部一致性指标可以推断测验是测量单一特质还是测量多种特质,从而为评估测量构想效提供证据分析受测者对题目的反应特点也可以作为构想效度的证据
2.测验间的相互比较通过分析几个侧眼间的相互关系,找出其共同之处,进而推断这些测验测量的特质是什么,也可以确定这些测验构想效度如何因素分析法是建立构想效度的常用方法
3.效标效度的研究证明
4.实验法和观察法正式
三、效标效度(实证效度)效标效度反映的是测验预测个体在某种情境下行为表现的有效性程度被预测的行为是检验效度的标准,简称效标根据效标资料是否与测验分数同时获得,又可分为同时效度和预测效度两类好的效标必须具备如下四个条件
①效标必须能最有效地反映测验的目标,即效标测验本身必须有效(有效)
②效标必须具有较高的信度、稳定可靠、不随时间等因素而变化(稳定)
③效标可以客观地加以测量,可用数据或等级来表示(可测)
④效标测量的方法简单,省时省力,经济实用(简单)㈡效标效度的评估方法
1.相关法
2.区分法
3.命中律法第三单元效度的功能
一、预测误差效度系数的实际意义常常以决定性系数来表示,决定情绪是不是需要读心术的平方,它表示测验正确预测或解释的效标的方差占总方差的比例估计的标准误Sest,它是指所有具有某。