【临床研究】中文版罗兰通用痴呆量表的信效度检验

lsjtg 2021-07-22

展开全文

文章来源：中华精神科杂志, 2021,54(3) : 197-203

作者：王凤王丽娜洪立葛晨希刘晓申周燕茹蔡亚秀张晨钱国英赵霞镇雪婷黄小琼

摘要

目的

检验中文版罗兰通用痴呆量表（Rowland Universal Dementia Assessment Scale， RUDAS）在我国痴呆人群中的信度及效度。

方法

采用方便抽样法，选取湖州市第三人民医院和湖州市2家养老院及3个社区卫生服务中心就诊及住院的痴呆患者358例，使用中文版RUDAS及MMSE量表对受试者进行施测。信度检验采用Cronbach α系数和重测信度，效度检验采用探索性因子分析和验证性因子分析；通过Pearson相关分析检验MMSE与中文版RUDAS的效标效度。

结果

中文版RUDAS共26个条目，探索性因子分析提取6个公因子，即视空间定向、模仿与判断力、视觉结构、延迟回忆、语言准确性、语言流畅性，其中语言沟通维度与原量表相比呈现降维现象；各条目因子载荷为0.594~0.960，累积方差贡献率为62.584%；验证性因子分析显示，卡方自由度=1.031，拟合优度指数=0.882，调整拟合优度指数=0.853，比较拟合指数=0.996，非规范指数=0.996，近似误差均方根=0.014；总体Cronbach α系数为0.793，各维度Cronbach α系数为0.503~0.930，重测信度为0.91。Pearson相关分析显示，中文版RUDAS总分与MMSE总分及各维度得分之间以及2个量表各维度得分之间均有相关性。

结论

中文版RUDAS在痴呆筛查方面的信度和效度较为稳定。

截至2019年底，我国65岁以上人口数约1.76亿^［^1］，65岁以上老年人口痴呆患病率为5.6%^［^2］，据此推算，我国痴呆人口数约986万，痴呆防治刻不容缓^［^3］。目前，我国常用的痴呆测评工具包括MMSE、临床痴呆评估量表（Clinical Dementia Rating， CDR）、长谷川痴呆量表（Hastgawa Dementia Scale， HDS）和极简短痴呆筛查测验等。然而，这些量表在实际应用中均存在一定局限性。HDS及MMSE易受人口学特征（年龄、性别及教育程度等）的影响^［^4, 5］，且MMSE对额颞叶认知障碍缺乏敏感性^［^6］；CDR需要临床医生的专业判断和知情者提供详细的患者信息，限制了人群应用的普适性^［^7］；极简短筛查测试识别痴呆的效力有限^［^8］。基于以上局限性，有必要引进并验证一种新的痴呆筛查工具以弥补现有工具的不足之处。罗兰通用痴呆评估量表（Rowland Universal Dementia Assessment Scale， RUDAS）由澳大利亚学者Storey及其团队研发。该量表用于痴呆筛查较少受人口学特征的影响，具有较好的文化适应性^［^6， 9］，用于早期痴呆筛查具有较好的敏感性和特异性，且对额颞叶痴呆较为敏感^［^{9, 10, 11, 12］}，省略了知情者和照护者的主诉。验证RUDAS在我国应用的适用性，可为痴呆筛查提供一种新型筛查工具，促进痴呆评估向更加精细化的方向发展，进一步完善痴呆评估技术的理论体系。然而，我国鲜有研究探讨RUDAS在痴呆筛查方面的效能，本文中对中文版RUDAS在筛查我国痴呆患者中的信度和效度进行研究，以期为我国医务工作者在不同医疗情境下选择一种适宜的痴呆筛查工具提供依据。

对象和方法

一、对象

本研究为横断面调查研究，采用方便抽样法选取2018年3月至2019年1月在湖州市第三人民医院老年精神科门诊就诊者、湖州市3个社区卫生服务中心（仁皇山社区卫生服务中心、滨湖街道社区卫生服务中心、章家棣社区卫生服务中心）就诊者及2家养老院（德清爱慕佳养老院、毗山养老院）入住者作为研究对象进行筛查。纳入标准：（1）年龄≥60周岁；（2）意识清楚；（3）记忆减退（主诉或知情者提供佐证信息）；（4）10分≤MMSE<26分。排除标准：（1）当前患有其他严重精神疾病或躯体疾病者；（2）存在语言、视力及听力严重损害，不能配合完成问卷者。

本研究已获得湖州市第三人民医院伦理委员会伦理审批，批号：2018 伦审第［032］号。所有被试者均知情同意并签署了知情同意书。

二、方法

1.一般资料问卷：自行编制一般资料问卷，具体内容包括年龄、性别、受教育程度、婚姻状况、躯体疾病情况及有无痴呆家族史等。

2. RUDAS：RUDAS由澳大利亚学者Storey及其团队针对多文化背景人群编制，用于痴呆筛查的评估工具^［^12］。该量表由乐知学院洪立女士从澳大利亚引进并进行翻译，后经国内2名精通英文的学者将其回译成英文，并与研究小组成员（1名心理学专家、2名神经医学专家及1名老年医学专家）对英文原稿、回译稿进行比对和文化调适，形成中文版RUDAS。本研究对洪立女士授权的中文版RUDAS进行验证。中文版RUDAS^［^13］共包含6个维度：（1）延迟回忆维度：通过对4个物品的延迟回忆进行测评，每回忆正确1个物品即得2分，回答错误不得分，总分8分；（2）视空间方向感维度：通过受试者对位置的判断进行评分，共8个条目，回答正确得1分，回答错误不得分；（3）绘画维度：要求受试者复制1个四边形的立方体，画出外部框线得1分，画出内部框线得1分，画出的图形为方块状得1分，总分3分；（4）判断力维度：通过让受试者回答“安全通过马路”的方法进行评分，回答注意来往车辆得2分，回答出其他方法得2分，共4分；（5）语言维度：要求受试者在1 min内尽可能多的说出所知道的动物名称，根据其回答数量进行评分，回答一种动物得1分，总分8分；（6）模仿练习维度：受试者模仿施测者动作，一手握拳，另一只手手掌朝下放在桌子上，两只手同时交替进行。完全正确（10 s内无差错或错后自己可以正确纠正，能够很好的保持动作且同步性好）得 2分，部分正确（明显有错误且有几次试图自我纠正，几次试图保持动作，同步性差）得1分，不能模仿（无法完成这一动作，或无法保持动作，或无法尝试）得 0分，共2分。量表总分30分，测试时间10~15 min，得分越低，提示认知功能越差。RUDAS得分低于22分为痴呆^［^12］。

3. MMSE：MMSE由国外学者Folstein于1975年编制，目前广泛应用于痴呆筛查。该量表包含：定向力、记忆力、数字计算能力、语言能力及视空间能力等6个维度，总分30分，分数越高，提示认知功能越好^［^14］。根据认知功能分级显示，26~30分为正常认知，21~25分为轻度痴呆，10~20分为中度痴呆，9分及以下为重度痴呆^［^15］。MMSE用于痴呆筛查的重测信度为0.80，敏感度为80%~90%，特异度为70%~80%^［^16］。本研究中以10分≤MMSE<26分作为轻中度痴呆筛查界值。

4.样本量评估：一般认为量表条目数与样本量之间的比例为1∶5~1∶10时，研究结果较为可靠。本研究中条目数为26条，考虑到15%的失访率，为保证结果的稳定性，样本量最低确定为300例。有研究显示，验证性因子分析最少样本量为150^［^17］。因此，使用SPSS 21.0软件随机抽取150例样本用于结构验证，剩余样本进行探索性因子分析。

5.评估过程及质量控制：使用MMSE对所有被试者进行初筛，初筛为轻中度痴呆患者则进行RUDAS测试。采用方便抽样法，分别在上述3个抽样场所选取20例痴呆患者进行预测试，调查开始前向受试者介绍研究目的、意义，取得受试者或家属的知情同意并签署知情同意书。利用预测试的反馈信息对测量中存在的问题进行汇总（包括标准术语不易解释，调研时患者易产生焦虑等），并组织研究小组进行讨论，提出改进措施后实施正式测试。所有测试人员（2名具有丰富临床经验的临床医生，2名具有10 年以上教学及临床经验的护士及2名研究生）进行规范化培训，包括纳入和排除标准、量表的填写方法、注意事项、指导语及专业术语的解释等进行标准化培训，培训结束后进行评定者间一致性评定，评分相关系数为95%。调查过程中使用统一的指导语和标准化的语言对受试者进行面对面的测量。由测试人员根据受试者实际回答情况进行评分，量表完成后进行整体检查，及时补充漏填项目，以保证量表的准确性和完整性。方便抽样法抽取20例受试者在首次测试完成后1周进行再次测试用于计算重测信度。

6.统计学处理：运用 SPSS 21.0 进行数据的录入与分析，将受试者RUDAS总分进行由高到低排序，选取前27%为高分组，后27%为低分组，对2组得分进行t检验或者非参数检验，采用临界比值法对量表进行项目分析，人口学资料组间比较采用χ²检验。采用Cronbach α系数和重测信度进行信度检验。效度检验：首先，采用探索性因子分析初步探索样本数据与原始量表因子结构的拟合程度；其次，应用AMOS21.0通过验证性因子分析再次验证量表新拟合的因子结构是否稳定。通过Pearson相关性分析检验MMSE与中文版RUDAS的效标效度。

结果

一、受试者一般资料

共发放量表380份，调查中途退出5例，重度视、听力受损5例，剔除漏填、错填问卷12份，最终获得358份样本，有效回收率为94.2%。纳入358例受试者进行调查，其中男126例（35.2%），女232例（64.8%）；60~70岁22例（6.1%），71~80岁175例（48.9%），81岁以上161例（45.0%）；受教育程度文盲81例、小学129例、初中84例、高中38例、大专及以上26例，不同受教育程度组间比较差异有统计学意义（χ²=106.777，P<0.01）；婚姻以已婚状态为主（323例，90.2%）；农村187例（52.2%），城市171例（47.8%）；以合并躯体疾病人群为主（280例，78.2%）。358例受试者中明确诊断痴呆80例，包括15例血管性痴呆，30例阿尔茨海默病，15例混合性痴呆，10例额颞叶痴呆，3例路易体痴呆，7例其他型痴呆。将受试者RUDAS总分进行由高到低排序，高分组共71例，低分组共58例。

二、中文版RUDAS各条目项目分析

项目分析结果显示，各条目决断值为3.541~11.215，各条目的差异具有统计学意义（均P<0.01）。各条目与总分的相关系数为0.42~0.67（均P<0.01），各条目具有较好的鉴别度，均可予以保留。

三、中文版RUDAS效度检验

1.探索性因子分析：对208例受试者数据进行探索性因子分析显示，Bartlett球形检验χ²=2 860.779（P<0.05），kmo=0.798，各条目间存在公因子，适合进行探索性因子分析。采用主成分分析法和最大方差变异法进行正交旋转，根据kaiser准则，选取初始特征值>1的因子共6个，共提取6个主成分，可解释62.584%的总变异。结合旋转后因子碎石图分析显示，从第6个因子后，坡度线较为平坦，因子间共同成分较少，因而保留6个因子；见图1。最大方差旋转后的成分矩阵显示，各条目因子载荷为0.594~0.960，因而对所有条目均予以保留。提取的6个因子分别命名为视空间定向、模仿与判断力、视觉结构、延迟回忆、语言准确性、语言流畅性。转轴后矩阵列表见表1。

图1 旋转后因子分析碎石图（n=208）

2.验证性因子分析：在探索性因子分析的基础上，使用AMOS 21.0对中文版RUDAS的 6个因子结构进行验证。对150例受试者进行验证性因子分析，采用最大似然法对量表结构进行验证。

初始模型（Model 1）χ²/df=1.150，拟合优度指数（goodness-of-fit index）=0.868，调整拟合优度指数（adjusted goodness-of-fit index）=0.837，比较拟合指数（comparative fit index）=0.981，非规范拟合指数（tuker-Lewis index）=0.979，近似误差均方根（root mean square error of approximation）=0.032。Model 1中修正指标值显示，增列误差项e2与误差项e3，误差项e3与误差项e4，误差项e20与误差项e21的共变关系后，所降低的χ²值较大。修正后的模型（Model 2）结果显示，所有误差方差均为正数且小于1，可以进行模型拟合度检验，Model 2 χ²/df=1.031，拟合优度指数=0.882，调整拟合优度指数=0.853，比较拟合指数=0.996，非规范拟合指数=0.996，近似误差均方根=0.014，模型适配度指标均在可接受范围。

3.RUDAS与MMSE的效标关联效度：采用MMSE作为中文版RUDAS的效标量表。Pearson相关分析显示，中文版RUDAS总分与MMSE总分及各维度得分之间，以及2个量表各维度得分之间均具有相关性（均 P<0.05），具体见表2和表3。

四、中文版RUDAS的信度检验

中文版RUDAS总体Cronbach α系数为0.793，除模仿与判断力维度Cronbach α系数为0.503外，其余各维度Cronbach α系数为0.657~0.930，重测信度为0.91。

讨论

本研究测试过程中受试者具有较好的配合度，对量表各条目内容较易理解，量表总条目数约26项，需10~15 min完成。同时，RUDAS中增加了对额颞叶功能进行评估的条目，例如，“过马路”“语言能力”（动物名称）“立方体绘制”等，这些条目有助于迅速识别额颞叶受损的患者^［^18］。此外，每道题目的得分根据受试者实际回答情况进行分级。例如，在“模仿练习”中，要求受试者模仿研究员的动作，动作完全正确得2分，部分正确得1分，不能模仿得0分。这种计分方式考虑了任务完成的中间状态答案，能够反映受试者的实际情况。总体而言，中文版RUDAS具有较好的适用性和可行性。

本研究结果显示，中文版RUDAS的总体Cronbach α系数为0.793。国外学者对RUDAS进行本土化验证显示，其总体Cronbach α系数为0.70~0.74^［^{18, 19, 20］}，本研究结果稍高于既往研究。间隔1周后，RUDAS重测信度为0.91，与Storey等^［^13］的研究结果基本相符，表明中文版RUDAS具有较好的跨时间稳定性。本研究中量表各条目对应公因子载荷为0.594~0.960，6个公因子累积可解释62.584%贡献率，各公因子主题归类合理，可以构成RUDAS的整体结构。同时，模型各项适配度指标均符合适配标准^［^17］，提示该模型具有良好的稳定性和拟合度，最终中文版RUDAS由视空间定向、模仿与判断力、视觉结构、延迟回忆、语言准确性、语言流畅性共6个维度构成。

中文版RUDAS中模仿与判断力维度的Cronbach α系数为0.503，内部一致性低于0.6，这可能是由于模仿与判断力合并为一个维度，条目评估方向不同所致。原版RUDAS中模仿维度易受教育程度影响^［^21］，使受试者之间模仿维度得分存在差异，导致其Cronbach α系数较低。本研究中模仿与判断力维度最终归为一个维度，可能是这2个维度均受教育程度的影响。农村受试者教育程度普遍低于城市受试者，导致其分数呈现一致的分布趋势，在相关性分析中模仿维度得分与判断力维度得分具有较好的相关性。虽然模仿与判断力维度Cronbach α系数稍低，综合临床实践与其实际意义后，暂保留此维度。同时，中文版RUDAS的条目受试者较易理解，各条目内容与我国文化背景基本相符，故未对其进行修改。这进一步验证了RUDAS在不同国家进行验证时不需要改变其条目内容的结论^［^19］。

另外，原量表中语言能力维度（条目19~26）在本研究中被重新划分为2个维度，分别命名为语言准确性（条目19~23）和语言流畅性（条目24~26）。语言能力维度出现降维现象可能的原因包括：一方面，轻度痴呆患者的语言功能优于中度痴呆患者^［^22］，从而导致语言能力维度所属的个别条目重新归类；其次，轻、中度痴呆患者认知功能的差异可能导致了原量表语言能力维度的细分。Zhang等^［^23］研究发现，轻度痴呆患者在语言流畅性任务中，1 min内可说出6~9个物品，中度痴呆患者可说出4~5个物品，这与本研究结果一致。另一方面，RUDAS主要根据澳大利亚人口学特点进行开发与应用，与我国人群相比，澳大利亚受试人群受教育程度较高^［^10］。这种受教育程度的异质性可能导致语言能力维度结构的进一步细分。

本研究中MMSE与中文版RUDAS的总分相关系数为0.737，与Naqvi等^［^24］汇总后的估计值一致，表明2个量表显著相关。尽管2个量表总分及各维度得分之间均具有相关性（P<0.05），但中文版RUDAS总分与MMSE量表的回忆能力维度和语言能力维度得分的相关系数稍低，分别为0.282和0.209。回忆能力维度和语言能力维度得分与MMSE总分的相关系数分别为0.337（P<0.05）和0.378（P<0.05）。MMSE量表与中文版RUDAS维度间得分的相关系数小于总分相关性，表明2个量表既有一致性，又存在差异性，原因可能：一方面，中文版RUDAS与MMSE均是对患者整体认知功能的测试，因此两者总分呈现较好的趋同性；另一方面，2个量表各维度归属的条目内容、条目数量、计分方式及题目难易程度均有差别，这些异质性一定程度上削弱了2个量表维度间的相关性。同时，这种差异性提示MMSE和中文版RUDAS用于痴呆筛查的诊断价值方面可能存在差异^［^25］。

已有研究证实，我国现应用于痴呆筛查的MMSE量表存在一定不足，易受人口学变量的影响；对额颞叶功能障碍缺乏敏感性^［^6， 26］；需知情者提供部分信息^［^27］；而中文版RUDAS具有简单、易行，并省略了知情者佐证的特点；虽然本研究尚未开展中文版RUDAS的诊断性试验研究或2个量表诊断试验的对比研究，但既往文献显示，RUDAS在早期准确识别痴呆方面具有较好的敏感性^［^9］；对额颞叶痴呆较为敏感^［^13， 28］。然而，RUDAS在实际应用中亦存在一定局限性，如RUDAS测评得分受教育程度的影响^［^9］，缺少时间定向力测试项目^［^18］等，而时间定向力是认知功能下降的强预测因子^［^29］。

既往研究中将RUDAS进行实践应用发现其具有较好的信效度。痴呆筛查评定者间信度为0.99，重测信度为0.98^［^13］。Rowland等^［^28］在社区人群中对MMSE和RUDAS的测试性能进行对比发现，RUDAS用于社区痴呆筛查的诊断价值AUC值（0.92）与MMSE接近（0.91）。同时，多国学者将RUDAS用于筛查本国痴呆人群发现，RUDAS用于痴呆筛查的敏感性、特异性及最佳截断值具有地域（移民地区与非移民地区）和人群差异（高教育程度与低教育程度，发达国家人群特征与发展中国家人群特征）^［^{10， 13， 30］}。因此，中文版RUDAS在我国地域和人群特征背景下用于痴呆筛查的最佳截断值还有待进一步探究。鉴于本研究结果及各国研究实践，可尝试将中文版RUDAS应用于我国医疗实践中，这将有利于初步区分认知正常者和可疑痴呆个体。

本研究存在以下不足：第一，样本代表性有限，今后应开展大样本多中心的研究；第二，中文版RUDAS用于我国痴呆筛查的敏感性、特异性、临床筛检截断值以及人口学因素对量表得分变异的贡献情况还有待于深入探索；第三，仅在痴呆人群中对RUDAS的信效度进行了验证，未来研究可尝试将RUDAS应用于其他临床疾病情境下，以探索RUDAS在临床应用的新功能；第四，既往研究显示，RUDAS在额颞叶痴呆的筛查上具有独特的优势^［^13， 28］，本研究额颞叶痴呆样本量有限，未来研究将固定痴呆诊断分型，进一步探索中文版RUDAS在额颞叶痴呆方面的筛检价值；第五，本研究中语言能力维度出现了降维现象，“语言维度”在轻度、中度认知障碍受试者之间呈现差异性分布，这可能是区分轻度、中度痴呆的一个重要筛查线索。然而，这种“分型”线索是否有效，以及判定的“截断个数”仍需要严格的试验设计加以探索和验证。最后，中文版RUDAS因子结构与原始量表因子结构拟合优度的对比研究还有待于进一步完善。

参考文献（略）