【心理学考研必背30天】 倒计时10天-测量 【第二章】经典测量理论 搭配万人冲刺大背书使用更佳 1.模型: X = T + E。其中X指观察分数,即施测分数。T指真分数,反映被试某种心理特质真正水平的数值,是无数次测量的平均值,是一个理论上构想出来的抽象概念。E指随机误差分数,观察分数和真分数之间的差距。 2.3条假设公理 ① 若一个人的某种心理特质可以用平行的测验反复测量足够多次,则其观察分数的平均值就会接近于真分数。 ② 真分数和误差分数之间相关为0。 ③ 各平行测量上的误差分数之间的相关为0。 @ 导出公式:S2x;=S2T+S2E;=S2V+S2I +S2E ,其中, 真分数的变异可以分成2个部分,与测验目的有关 的变异S2V,和与测验目的无关的变异S2I (即系统误 差),即 S2T=S2V+S2I 。 Tips:注意经典测量理论模型 赵氏口诀:重复分,同一评 1.重测信度 ① 含义:用同一个测验,对同一组被试前后2次施测所得结果的一致性程度,又称稳定性系数。其大小等于2次测验分数之间的皮尔逊积差相关系数。估计测验跨时间的一致性。 ② 计算:皮尔逊积差相关。 ③ 条件: A. 所测特质须稳定。 B. 遗忘和练习的效果基本上相互抵消(智力测验间隔6个月左右)。 C. 2次施测之间,被试在所要测查的心理特质 方面没有获得更多的学习和训练。 ④ 误差来源:主要是时间间隔,还包括其间测验条件和受测者身心状况的改变、测验所测特质本身不稳定等。 ⑤评价 A. 优点:能提供测验结果是否随时间而改变的 资料,可作为预测受测者将来行为表现的依据。 B. 缺点:易受练习和记忆的影响、只适用于测量 那些不会随时间变化而改变的特质。 2.复本信度 ①含义 用2个平行的测验对同一组被试进行施测所得结果的一致性程度。2个复本同时连续施测的,这是等值性系数,估计测验跨形式的一致性;2个复本是相距一段时间分别施测的,这是稳定性与等值性系 数(信度最严格的检验,其值最低),估计测验跨时间和形式的一致性。 ②计算:皮尔逊积差相关。 ③条件: A. 能够构造出2份及以上的真正的平行测验(内容、形式、难易等方面相同或相似)。 B. 被试要有条件接受2个测验。 ④来源 A. 等值性系数的误差,主要是由题目内容造成,被试方面的情形波动、动机变化等。 B. 稳定性与等值性系数的误差,主要有题目内容、测试时间间隔等。 ⑤ 评价 A. 优点:应用范围较重测信度的范围大。 B. 缺点:严格的平行测验很难构造;容易受练习、记忆和迁移的影响;测验的难度会由于重复而改变。 3.分半信度 ①含义:将一个测验分成对等的两半后,所有被试在这两半测验上所得分数的一致性程度。估计跨两个分半测验间的一致性。可按题号的奇偶性、题目难度、题目内容分半。 ②计算:两半分数之间的积差相关系数再用校正公式校正。校正公式有:斯皮尔曼一布朗公式、弗朗那根公式和卢仑公式。 斯皮尔曼一布朗公式: ,rhh两半测验分数间的相关系数,rxx为整个测验的信度值。 ③ 条件 A. 通常在只能施测一次或没有复本的情况下使用。 B. 测验可以分半时才能使用。 ④ 误差来源:主要来源于题目本身,与时间因素无关。 ⑤评价 A. 优点:可在没有复本的条件下使用。 B. 缺点:有些题目难以分半,不同分半方法之间有差异,不适合用于速度测验。 4.同质性信度 ① 含义:测验内部所有题目间的一致性,也称内 部一致性系数;用于估计测验跨项目的一致性。有2 层含义:所有题目测的都是同一种心理特质;所有题 目得分之间都具有较强的正相关。 ②计算:克隆巴赫α系数、库德理查逊公式20、 库德理査逊公式21、荷伊特信度、因素分析。 克龙巴赫α系数: K:题目数;S2i:每题方差;S2x:总分方差。 ③ 条件: 同质性信度根据测验目的不同而不同:用于预 测的测验或学绩测验可不考虑,在提出或验证某种 心理学理论的概念和假设时须考虑。 ④ 误差来源:主要来源于内容取样和所研究行 为的异质性。 ⑤评价 A. 优点:只施测1次,可以排除练习和记忆的效果。 B. 缺点:只可在测量单一概念的测验上使用,不适用于速度测验。 5.评分者信度 ① 含义:多个评分者给同一批人的答卷进行评 分的一致性程度。估计测验跨评分者的一致性。 ②计算:评分者为2个时使用积差相关或等级 相关,评分者多于2个时使用肯德尔和谐系数(W系 数),被评对象多于7个时使用卡方检验等。 ③ 条件:适用于一些无法完全客观计分的测验, 如创造力测验及投射测验等。 ④ 误差来源:评分者之间的差异。 ⑤评价: A, 优点是适合无法完全客观计分的测验。 B. 缺点是容易受到评分者主观判断的影响。 1.影响因素 ① 主试方面 A. 施测者不按规定施测,故意制造紧张气氛,或给考生一定的暗示、协助等,信度会降低; B. 评分者评分标准掌握不一,信度降低。 ② 被试方面 A. 就个体而言,被试的心理特质水平的稳定性, 如其身心状况、注意力、态度等; B. 就团体而言,离散程度和团体的平均水平。团体同质性越大,全体得分分布越窄,信度越小,可能低估信度;反之可能高估信度;团体均分过高或过低,都会使得分分布变窄,低估信度。 ③ 测量工具方面 测量工具是否稳定、试题取样、试题难度、测验长度、试题之间的同质性程度(1套测验中同质性题目越多,同一特质被考查的次数越多,全体得分分布越广,信度越高)等。 ④施测过程方面 考场是否安静、光线和通风是否良好、设备是否齐全、桌面是否合乎要求。另外,对于计算稳定性系数及稳定性与等值性系数时,2次测验间隔时间越 短,信度越高。 赵氏口诀:被猪拱过 2.改进方法 ① 主试方面:主试严格执行施测规程,评分者要严格按标准给分。 ②被试方面:选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度。 ③测量工具方面:精心编制测验量表,避免出现较大的系统误差。适当增加测验长度,但新增项目须与原题同质,且新增项目须适度;使所有题目难度接近正态分布,并控制在中等水平,使得分分布更广;努力提高试题的区分度。 ④ 施测过程方面:施测场地按测验手册的要求 进行布置,减少无关因素的干扰。 赵氏口诀:被猪拱过 |
|