心理测量学基本概念和常考公式及其计算

殷翠艳 2015-12-20

展开全文

心理测量学基本概念和常考公式及其计算

一、重点公式及计算
1、一个包括40个题目的测验信度为0．80，欲将信度提高到0．90，通过斯皮尔曼一布朗公式的导出公式计算出至少应增加()个题数。
A、60 B、100  C、50  D、40
此题可见基础教材第355页，须注意，教材中这个地方已被勘误过。正确的是 K=2.25，测验长度应为原来的2.25倍，90个题目。即需要增加的题目数为90-40，50个题目。正确答案：C、50。
2、下面是某求助者的WA I S-RC的测验结果。
言语测验（VIQ）量表分：知识 12、领悟 10 、算术 7、相似性 1l、数字广度 6、词汇 13；操作测验（PIQ）量表分：数字符号 9 、图画填充 8 、木块图 6 、图片排列 7 、物体拼凑 10 ；VIQ=96 、PIQ=87 、全量表的平均分为9
问题：求助者词汇测验得分的百分等级是( )。选项：A.16  B.50  C.84  D.98
正确答案：C
遇到这种问题，只要记住10为平均数，标准差是3的情况下，得分为13的话正好高出一个标准差，高出一个标准差对应的百分等级就是84。（注：本题是韦氏智力测验，它以10为平均数，3为标准差。遇到此类问题要记住，处于平均数的位置它的百分等级是50，高于一个标准差百分等级是84，高于2个标准差百分等级是98，低于一个标准差百分等级是 16，低于2个标准差百分等级是2）
3、智龄的计算：
假如某儿童4、5、6岁组的题目全部通过，7岁通过4题，8岁通过3题，9岁通过2题，其智龄为（）。
以其全部通过的最高年龄为起点，6+4*2+3*2+2*2=6岁+18月= 7岁6个月
4、百分等级公式： PR=100-（100R-50）/N
小东在30名同学中语文成绩是80分，排列第五名，那么他的百分等级是（）
PR=100-（100*5-50）/30 =85
5、如果要挑得分高的20%的被试，须求出相当于（  ）百分等级的测验分数。80
6、离差智商的计算公式：

7、测量标准误的估计公式中，SX代表（    ）。所得分数的标准差
8、测验的效度是0.80，说明测验的总方差中有（    ）的方差是测验分数的方差。64%
二、重要的概念
1、高尔顿是第一个倡导心理测验的人，是使用评定量表和问卷法的先驱。并且他发展了分析个体差异资料的统计方法，不仅扩充了古特列特的百分位法，而且创造了粗浅的相关计算法。
2、美国心理学家卡特尔1980年发表《心理测验与测量》一文于《心理》杂志上，这是在心理学文献中首次出现“心理测验”一词。
3、 1904年比内为了鉴别弱智儿童，他与西蒙合作编制成了世界上第一个科学的智力测验--比内-西蒙量表。1905年，他在《心理学年报》上发表了文章《诊断异常儿童的新方法》，介绍了该量表，历史上称为“1905量表”。从此，比内-西蒙量表宣告诞生。
4、最有名的是1916年出版的美国斯坦福大学的推孟教授修订的“斯坦福-比内量表”这一量表首次使用了“智力商数”的概念，简称为IQ，是心理年龄和实际年龄的比值。
5、比较有名的几个测验。
智力测验：推孟的研究生欧提斯编制的团体智力测验，2 后在次基础上发展出美国陆军用甲、乙两种测验。有基于因素分析理论编制的测量多项能力的韦克斯勒的儿童智力量表。还有桑代克编制的标准化教育测验。
人格测验：1917年武德沃斯设计的“个人资料调查表”。1912年问世的罗夏克墨迹图测验（RIT）和于1943年首次出版，由哈撒韦和麦金利编制的目前影响最大的MMPI-明尼苏达多相人格调查表。
6、测量是：就是根据一定的法则用数字对事物加以确定。
7、测量的要素是：参照点和单位。
8、
（1）命名量表：只是用数字来代表事物或对事物进行分类。命名量表中的数字没有任何数值意义，不能作量化分析。无大小意义，只表明类别。无参照点和单位。无法比较大小或进行任何数学方法运算。
（2）顺序量表：表明类别的大小或某种属性的多少。主要用于分等论级和分类。数字仅表示等级并不表示某种属性的真正量或绝对值。无参照点（没有绝对零度）和单位。无法进行数学方法运算。
（3）等距量表：存在大小关系。无绝对零度，但存在相对零点。可以进行数学运算，有相等单位。
（4）等比量表：是最精确的测量。大多是物理量表。而心理量表只能达到等距量表水平。可以知道事物之间的某种特点上相差多少及它们之间的倍数关系。有相等单位和绝对零点。可以进行数学运算。
9、心理测量是：就是通过观察人的少数有代表性的行为，对反映在人的行为活动中的心理特征，依确定的原则进行推论和量化分析的一种科学手段。这一定义包含有至少三个基本要素：行为样本、客观测量和标准化。
10、关于心理测量中的标准化：心理测量要做到客观必须在测验编制、实施、评分、解释过程中减少主试和被试的随意性程度。标准化的测量是测量客观性的根本保证。
11、心理测验的性质：间接性、相对性、客观性。
12、心理测验的种类：
（1）按测验的内容分：能力测验（智力测验、反应能力测验）；学绩测验，如成套的成就测验；人格测验如EPQ、MMPI等。
（2）按测验的对象特点分：个别测验和团体测验。
（3）按测验表现形式分：文字测验（纸笔测验）和非文字测验。
（4）按测验的目的分：描述性测验、诊断性测验、预测性测验。
（5）按测验的时间分：速度测验和难度测验。
（6）按测验要求分：有最高作为测验和典型行为测验。
13、正确的测验观：
（1）测验是重要的心理学研究方法之一，是决策的辅助工具。
（2）心理测验作为研究方法和测量工具尚不完善。心理测验的最大问题是理论基础不够坚实。
（3）科学地看待测验，防止乱编滥用。
14、错误的测验观：测验万能论、测验无用论

15、常模团体：常模团体是由具有某些共同特征的人所组成的一个群体，或者是该群体的一个样本。
16、常模样本：找一个有代表性的样本来代表目标总体，也代表常模总体。这个用来代表常模总体的样本，就是常模样本。常模样本必须具备常模总体的基本特征。
17、常模样本的容量：总体的数目。一般情况，最小样本为30 ~ 100个。要是全国性的常模，一般地要求有2000 ~ 3000人为宜。
18、取样就是：从目标总体中选择有代表性的样本。一般地有两类取样方法：随机抽样和非随机抽样。具体说有：简单随机抽样、系统抽样、分组抽样、分层抽样。
19、常模分数：就是施测常模样本被试后，将被试的原始分数按一定规则转换出来的导出分数。
20、常模分数构成的分布是：通常所说的常模。它是解释心理测验分数的基础。
人们常常会忽略常模的时间性。常模分数和常模均会随时间的变化而改变，因此常模必须经常修订。
21、常模的表示方法：表格法和图示法。
（1）表格法就是转换表法。这种表示常模分数分布的方法是最常见的。它有三个要素：原始分数、导出分数、常模样本的特征描述。
（2）图示法就是剖面图法。
22、参照常模的解释分数是：将被试的分数直接或间接地以常模样本中的相对等级或相对位置来表示。另一种常见法是以常模性质分，可分为：发展常模（反映心理发展程）、百分位常模和标准分常模。
23、发展常模：按发展常模来解释测验分数，某一测验分数就表示个人在以正常途径发展的心理特征方面处于一个什么样的发展水平。这些平均表现构成的量表就是发展常模，象智力年龄、年级当量、发展顺序量表等均为发展常模。
（1）发展顺序量表：是直观的发展常模，因为它告诉人们多大的儿童具备什么能力或行为就表明其发育正常。
（2）智力年龄：在比内-西蒙智力量表中首先使用了智力年龄的概念。智力年龄实际上是一种年龄量表。也是用年龄来表示测验分数。
以智力年龄为典型代表的年龄常模在做解释时确实非常简捷明了，但是智力年龄并不是单位恒定相等的，而是随年龄的增长而增大。另外，智力年龄的概念显然不适用于成人，成人到一定阶段后智力发展相对稳定，表现不出一年与一年之间的差别。
（3）年级当量：它实际上就是年级量表，测验结果说明属哪一年级的水平，在教育成就测验中最常用。
24、百分位常模是：把一个量表分成一百个位置，对不同的得分给予相应的等级评价，依据不同的等级对结果作出解释。
25、百分位常模可分两类：百分等级和百分点。
（1）百分等级：一个测验分数的百分等级式是指在常模样本中低于该分数人数的百分比。百分等级是应用最广的测验分数表示方法。
（2）百分点：又叫百分位数，百分点或百分位数于百分等级的计算方法正好相反。百分等级是计算低于某测验分数的人数百分化，而百分位数是计算处于某一百分比例的人对应的测验分数是多少。
（3）还有两种常见的变式：四分位数和十分位数。两者含义相似。
26、标准分常模：标准分数最常见的是z分数。标准分数是等距量表，它可以做加、减、乘、除运算。
常见的标准分常模：z分数、Z分数、T分数、标准九分数、离差智商（IQ）等。
标准分由原始分转换而来，这种转换又可分成：线性转换、非线性转换。
27、线性转换的标准分 - z分数（最典型的线性转换的标准分）。
（1）公式：z = X－X/SD
X为原始分, X为样本平均数，SD为样本标准差。从公式看，z的含义是：它表示某一分数与平均数之差是标准差的几倍。
（3） z的性质：
1 平均数为0，标准差为1。
2 z分数有正、负，其绝对值表示原始分与平均数间的距离正值表示原始分大于平均数，负值则相反。
3 z分数的分布形态与原始分分布一致。
28、非线性转换的标准分：
（1） T分数是：平均数为50，标准差为10的分数。即
这一词最早由麦柯尔于1939年提出，是为了纪念推孟和桑代克对智力测验，尤其是提出智商这一概念所作出的巨大贡献。
（2）标准九：是标准化九分制的简称。它是以5为平均数，以2为标准差的一个分数量表，最早时被广泛应用于美国空军的心理测验中。
标准九分数也是一种标准分，它将原始分划分为9部分，最高是9分，最低1分。除1和9的范围略大以外，其余均是以5为中心向两边各包含0.5个标准差的分数段。
29、标准分常模小结：
（1）标准分常模分数均是等距分数，虽然不同类型的常模其平均数和标准差不同，但均可用离均值来表示。
（2）标准分常模的局限性：标准化常模表示的是存在状态之间的横向比较，离开原常模样本，不同常模样本之间的比较就没有意义。
名称 z分数和z’分数 T分数标准九标准十标准二十
平均数 0 50 5 5 10
标准差 1 10 2 1.5 3
30、离差智商及其意义（传统比率智商的缺点）：
（1）心理年龄与生理年龄呈线性关系。用传统的比率智商，不同年龄组的标准差不相等，从10 ~ 20都有，因此智龄与年龄的发展并不是呈线性关系。
（2）智力增长到何时达终点仍在争论。
1 离差智商：通过与同2 年龄的代表性样本的平均数相比较来确定智商的高低。
离差智商是一种常态化标准分数，因而其计算方法与其他标准分数一样，公式为：IQ = 100 + 15z’。由于离差智商的提出，过去使用比率智商的测验都改用离差智商，其公式为：IQ = 100 + 16z’。两者唯一的区别是标准差：一个是15，一个是16。

31、信度是指：测量结果的可靠性和一致性
32、信度的操作化定义：
（1）误差理论认为：一个人的测验分数X是由真实分数（T）和误差（E）两部分构成的，公式是X = T + E。
（2）因此信度就被定义为：一组测量分数的真实方差与实得方差的比，或者是指真实方差占总方差的百分比。公式为：rxx = 1－SE 2／SX 2
（3）根据统计学理论，真实方差与实得方差的比是一个相关系数的平方，所以我们把这种相关系数的平方叫做信度系数。
（4）计算公式为：rxx = ST2／SX2
33、由于误差的来源信度的可分为：这种分类是基于信度的传统定义-真分数理论。
（1）重测信度：考虑的误差来源是时间取样。
（2）复本信度：考虑的误差来源是内容取样。
（3）分半信度：它考虑的误差来源也是内容取样，它与复本信度的差别是：分半信度考查一个测验内容的两半题目测量的是否是同一个心理特点行为。
（4）同质性信度（内部一致性系数）：考虑的是测验内容是否异质。
（5）评分者信度：考虑的误差来源是评分者间的差别。
34、信度的表示方法：
（1）信度系数和信度指数：
1 信度系数：rxx = rx2T = S2T／S2
2 信度指数：rXT = ST／SX
（2）测量标准误：SE = SX 1－rxx
35、信度的意义：
（1）信度系数可以解释为样本测验分数的总方差中有多少比例是真分数方差，也就是测验的总变异中真分数造成的变异占百分之几。它直接告诉我们测量的误差有多大。
（2）测量的标准误可以告诉我们有多大可能性真实分数在某一分数范围内，并且可以预测实得分数再测时可能的变化情况。
36、信度的作用：
（1）解释预测个人分数的意义。
（2）解释真实分数与实得分数间的关系，明确告诉我们测验误差大小。
（3）新编的测验信度应高于原有的同类测验或相似测验。
（4）下结论说某测验比较可靠，必须是依据情境的，经多次证实的。
（5）它是确定测验好坏的一个指标。一般的原则是：
1 当rxx< 0.70时，测验不能用于对个人作出评价或预测，而且不能做团体间比较。
2 当0.70≤rxx<0.85时，可用于团体比较。
3 当rxx ≥0.85时，才可以用来鉴别或预测个人成绩或作用
37、重测信度：有时也叫稳定性，主要针对时间变量。
（1）重测信度采集数据得方法是：对同一组被试间隔一定的时间重复测试一次。
（4）重测信度的计算方法是积差相关法，因而rxx就是皮尔逊的积差相关系数。
（7）重测信度的时间间隔选择依测验性质和目的而定，如果测验是用于长期预测，则测量间隔长一些。对儿童的智力测验一般是两周到四周为宜。对成年人，间隔可到半年，很少超过6个月。
（13）使用重测信度应注意：不是所有测验都可以计算重测信度。并且重测信度只是反映了随机误差的影响，而不是反映被试心理特点的长期变化。
38、复本信度：又叫等值性系数。
（1）数据采集方法是：给被试施测两个内容等值但题目不同的测验，求两组数值的相关。计算方法常见的也是积差相关法。
（2）复本信度的高低反映了两个互为复本的测验等价的程度，而不是反映一个测验本身受随机误差影响的大小。复本信度的高低关键取决于复本测验的选择，因而施题目取样问题，或者说是测验的内容取样问题。
（3）复本信度优于重测信度的地方是：避免了重测带来的记忆效应和练习效应；可用于长期追踪研究前后测量；减少了作弊的可能性。
（4）复本信度的缺点：有些测验的复本很难找到；有些测验因正迁移效应使测验性质改变；如测量的内容很容易受练习的影响，复本信度也无法清除这种练习效应。
（5）重测复本信度，即再不同的时间里施测两个等值的测验（复本），得到的相关就是重测复本信度，也叫稳定等值系数。它比单一的重测信度或复本信度都要严格、全面一些。
39、斯皮尔曼-布朗公式：rnn = nrtt／1 +（n－13、 1）rtt，14、 rnn是校正以后的相关系数，15、 rtt是实得的相关系数，16、 n为rnn对应的测验长度与rtt 对应的测验长度之比。分半时，17、 n = N／（N／2）= 2（N为测验全长），18、所以分半法信度的校正公式是：rxx = 2 rnn／1 + rhh 其中rhh为两半测验的相关系数。
（1）卢伦公式：rxx = 1－Sd2／Sx2 其中Sd2是两半测验分数之差的方差，Sx2为总方差。
（2）从理论上分析，分半信度反映的实际上是两半测验能够测量相同内容或心理特点的程度。了解一下
40、内部一致性信度（同质性信度）：同质性是指测验的所有题目间性质的一致性，即测的是同一种心理特质或行为。同质性是测量单一特质的必要条件。这里讲的同质性是指测验题目得分反映的心理特质一致，同质性的判别标准是：题目间呈高正相关，如果相关很低或是呈负相关，则题目为异质。
（1）库德和里查德森提出的K-R20公式只适合预测题目是二分法计分的。克伦巴赫α系数适合于非二分法计分的测验的内部一致性信度估计法。
（2）从同质性信度的含义我们不难看出，分半信度是求测验两半之间的一致性或同质性，而同质性是求所有题目间的一致性。因此分半信度实际上是同质性信度的一种，可以作为测验同质性评价的粗略估计指标。因为可以根据测验得分来推论或验证某种概念或理论构思，因此同质性信度也是一种构思效度，或叫结构效度，它实际上介于信度与效度之间。
41、评分者信度：有些心理测验的得分不是根据客观的计分系统计分的，是由评分者来给被试打分，因此，这样的测验的可靠性如何取决于评分者评分的一致性和稳定性如何。
评分者信度因评分者人数不同而估计方法不一样。如果是两个评分者，独立对被试的反应评分，则可以用积差相关来计算，或用斯皮尔曼等级相关法计算。如果评分者在三人以上，而且是等级评分，则可以用“肯德尔和谐系数”（W）来求评分者信度。。
42、常见的影响信度的因素有：样本特征、测验的长度、测验的难度、测量的时间间隔等。
43、我们做信度考验时，常常选取一个与常模样本性质相同的样本施测，根据被试得分求出信度系数。
（1）样本团体得分分布的影响：求信度的样本团体得分分布如果比较窄小的话信度就低。
（2）样本团体异质性的影响：样本团体异质的话，测验分数的分布就比同质样本的要广，分数的离差就大，样本的方差就大，信度就高。实际上，高信度可能是假性高信度，是由样本团体的异质造成的。但如果常模总体要求各种各样的人，则异质的信度样本求得的信度就是真信度。这时，相反的情况就需要校正信度。
（3）样本团体平均能力水平的影响。由于信度也会因样本间团体平均能力水平的不同而不同，因此在求信度时，一定要注意信度样本与常模总体间是否一致。
44、测验的长度：在其他条件均等的情况下，测验越长，信度越高。原因在于：
（1）测验越长，即题目越多，测验的内容取样就越有可能有代表性。
（2）测验越长，被试的猜测因素影响就越小。
45、测验的难度：难度对信度的影响之存在于某些测验中，如智力测验、成就测验、能力倾向测验、教育测验等。测验的难度对信度有间接影响，因为如果测验过难，被试的得分会集中在低分区。过于容易，分数则集中在高分区。两种情况都使信度样本的得分范围变窄，变异量降低，从而低估测验信度。
46、测验的时间间隔：这一因素之对重测信度和不同时测量时的复本信度有影响，对其余的信度来说不存在时间间隔问题。
47、信度效度的关系
48、效度的概念、评估的方法、功能以及影响效度的因素