分享

拨开迷雾,看清盲点,大数据帮你驱走“心魔”——一位心理治疗师的救赎

 造就Talk 2020-07-21

本文是根据一位美国心理治疗师的自述整理编辑而成。它让我们看到,从业者的狭隘、偏见、固执导致新技术在传统行业中的推广有多么困难。同时也让我们眼界大开,原来大数据在心理治疗领域能有如此大的用武之地。

那一年,格蕾丝(Grace)已戒掉海洛因大约六个月;我则是一名受过专业训练的心理治疗师。2006年,格蕾丝开始找我做心理治疗的时候,她的生活一筹莫展:单身母亲,没有工作,谈过一连串男友,都有暴力倾向,她自己又吸毒成瘾。尽管如此,她还是勇敢地抗争,试图使生活回到正轨,并保住幼子的监护权。

治疗的重心,是支持格蕾丝参加戒毒互助会,减少她的焦虑感——她说,是焦虑让她一而再、再二三地使用毒品。头几个月,一切都很顺利。每周,她都会向我报告进展:参加了戒毒互助会,找到了一份工作,还找到了一个尊重她的男友。

由于事关她儿子的监护权,乃至她自己的生命,我们不愿考虑失败的可能性。我经常要求格蕾丝提供反馈。她总叫我放心,说治疗很有成效。但她的热情之中,总带有一丝绝望和刻意;她的语速通常很快,脸上的笑容也像是挤出来的。

在我工作的社区心理咨询培训点,一位心理学家每周都会来监督我的工作。她人很聪明,有着敏锐的观察力,在帮助戒毒者方面,有着几十年的经验。格蕾丝的治疗进行到第三周时,我告诉这位心理学家,格蕾丝进步非常之快,我们已经说好,将治疗频率从每周一次改为两周一次。“进步这么快,真是很不可思议。”我说。但她却比较谨慎,她说:“戒掉毒瘾很难,但坚持不去复吸,更难。”

她是对的。没过多久,格蕾丝就连续三次没来参加治疗。再次见到她时,她又吸上了毒品。后来,她丢了工作,也没了男友。不过,她还是会来找我治疗。各种治疗手段,能试的我都试了,但没什么长效的方案。从头到尾,她都坚持说,她可以的。“一定要乐观。”她说。

结果呢,复吸几个月后,格蕾丝死于吸毒过量,她的儿子也被送去寄养。这件事对我打击很大。我一下子陷入了危机:当初怎么做,才不会是今天这样的结果?要如何治疗病人,才会更有效?

四处寻找答案时,我想起了一年前,一位教授在课上讨论过的话题。当时,他看了一本名为《点球成金》(Moneyball)的书,讲的是奥克兰运动家棒球队对效果指标的革命性运用。他很想知道,心理治疗是否也能借助数据和分析,来发挥更好的作用。他介绍了一些前景不错的初步研究,但也指出,不少心理治疗师都持怀疑态度。

起初,我并不是很感兴趣。这条思路显得太不切实际、太学术化了,简直是对心理治疗这个行业的侮辱。怀揣着一股不经世事的傲气,我心想,心理治疗可不同于其他任何领域,它关系到人与人之间的关系,我们的工作是无法用数据来衡量的。然而,在格蕾丝去世后,我的心态开始放开。任何办法,只要能帮我修补盲点和弱点,我就愿意去了解。

我踏入这个行当,是受我自己的治疗师的影响。在我还是个问题少年的时候,他对我帮助很大。他曾说:“心理治疗是一门关系艺术。个人成长这种事是无法量化的。”当时,我并不太明白他的意思,但那些年,每当我抑郁、愤怒、焦虑的时候,他总能帮到我。

十五年后,我进了研究生院,我对心理治疗的看法还是没变:这是一种艺术,太微妙、太复杂,无法用数字衡量。不过,我失望地发现,我的很多患者都是在原地踏步,虽然双方都已竭尽全力。大约四分之一的患者在治疗了几周或几个月后就放弃了,连个理由都没留下。至少10%的人情况反而恶化。令我不安的是,我不能预测哪些人会停滞不前,哪些人会退出,哪些人的情况又会恶化。

从整体上讲,心理治疗可以非常有效。之所以要强调这一点,是因为许多人至今都怀疑——它究竟算不算真正的治疗?对于各种类型的心理疾患,从相对简单的(如飞行恐惧症),到棘手难治的(如边缘人格障碍),心理治疗都能起到效果,这方面已有大量例证。心理治疗也许不是对所有人都管用,但很多治疗身体病痛的药物,不也是如此吗?关键在于,它确实能帮到很多人。

尽管如此,同所有行业一样,心理治疗领域也存在巨大的改进空间。我接受培训时的经历就很典型,折射出的是一种更大的趋势:综观整个领域,治疗退出率约在25%或以上;最让人心寒的是,5%-10%的病人在治疗期间情况转坏。在心理治疗学诞生之初,在弗洛伊德探讨“可终止与不可终止的精神分析”之时,他就承认有这些问题的存在。

面对这些挑战,心理治疗师一直在努力提升治疗效果。近三十年来,这些努力很大一部分都聚焦于一个问题:哪种疗法最有效。然而,结果都不尽如人意。在研究中,人际关系疗法、情绪焦点疗法和认知行为疗法等诸多方式都显现出良好的效果,但更大范围的元分析显示,几乎没什么疗法存在持续的疗效优势。

当然,对特定患者来说,也许有的疗法效果好,有的则不理想。但若鼓励治疗师偏向其中某种疗法,效果可能并不好。

若外科医生、舞者或运动员在学习的时候,没有人观察他们的表现,他们只能自我反思,并向上级汇报,结果会是怎样?这正是许多心理治疗师所处的困境。

如果推广特定模式并不能改善疗效,那怎么办才好呢?正如美国心理协会所言,“患者和心理治疗师的个性特征都会影响治疗结果,而在患者的诊断或治疗师使用特定疗法时,这些通常会被忽略。”换言之,比疗法更重要的,是治疗师自己的技艺。治疗师能否建立信任,使患者敞开心扉?能否鼓励病人面对内心深处的恐惧?能否以温暖和同情对待患者,并在必要时,毫不留情?

医生要仰赖各种各样的仪器设备——听诊器、实验室化验、解剖刀。而在心理治疗中,心理治疗师自己就是最主要的“仪器”了。这又让我们回到了那个问题:治疗师本身该如何提升?这也是格蕾丝死后,我所面临的问题。

过去一个世纪,多数领域都经历了剧烈的变革。它们的进步史通常涉及两个密切相关的现象,而这两者都由科技带来。

其一是效果反馈,它让人更清晰地知道自己的表现如何。就比如慢动作视频技术对专业舞蹈的影响。

可惜在心理治疗领域,效果反馈的实施障碍也许比其他任何领域都大。由于心理治疗工作的私密性和敏感性,治疗师基本都是私密状态下工作,无从获取客观的反馈。若外科医生、舞者或运动员在学习的时候,没有人观察他们的表现,他们只能自我反思,效果肯定不会好到哪去?这正是许多心理治疗师遇到的困境。

诚然,我们可以从患者那里寻求反馈,询问他们哪些办法有用,哪些无用;多数治疗师都是这样做的。然而,只有当患者愿意袒露心声的时候,这样的询问才有效果。很多患者都会保留批评性质的反馈,尤其是在效果寥寥时。

在最近的一项研究中,哥伦比亚大学的马特·布兰查德(Matt Blanchard)和巴里·法伯(Barry Farber)调查了547名患者,询问他们在心理治疗中有没有说实话。结果发现,竟然有93%的受访者称,会向治疗师提供虚假反馈,通常是“假装治疗很有效”,“即便不想继续了也不承认”。如果病人不说实话,我们又怎么知道情况会不会恶化?当初,格蕾丝就是这样做的。

这就引出了20世纪推动其他众多行业、但偏偏遗漏了心理治疗的另一大进展:利用量化标准来预测可能出现的结果。对量化标准的最著名应用,就是当初启发那位教授的“点球成金”法:上世纪七十年代,一个名叫比尔·詹姆斯(Bill James)的棒球迷收集了大量被专业球队忽略的数据,比如长打率和上垒率。

从这些数据中,他开发出了一套统计学工具,用来预测棒球手的表现。最终,这些工具变革了棒球队的管理方式。类似的方法——即在浩瀚的心理治疗结果中寻找统计学规律——能否帮助治疗师更好地预测病情的发展轨迹呢?

过去数十年中,杨百翰大学的研究人员迈克尔·兰伯特(Michael Lambert)开发了一种系统,让患者在每次接受心理治疗前,回答一份由45个问题组成的问卷。调查结果以图表的形式,将每名患者的症状轨迹加以量化,帮助治疗师追踪进展。

在开发心理治疗的度量标准方面,兰伯特和他的团队也站在了最前沿。他们以数千个病例的历史数据为基础,构建算法,预测患者病情何时可能恶化。基于患者对调查问题的回答,如果显现出恶化迹象,治疗师就会收到不同颜色的提醒:红色代表退出治疗或状况恶化的风险,黄色代表治疗效果不如预期。初次接受测试时,这些算法虽只经历过三次微调,但在预测哪些病人的情况会出现恶化时,准确率已达到85%。

这就是如今的“反馈-告知-治疗”法(简称FIT法)。对治疗师而言,这个系统有两大好处:首先,它提供了一种直截了当的效果反馈,这是治疗师通常无从获取的。与其当面让治疗师失望,很多患者更愿意将症状的恶化情况反馈给计算机——虽然他们知道,治疗师最终还是会看到结果。

第二个好处来自度量标准:借助风险提醒,治疗师可以适时调整治疗方式,纠正自信过头的自然倾向,修复临床治疗中的盲点。有人进行过一项研究,要求一家诊所的48名治疗师做出预测,指出哪些病人的状况会“出现恶化”。只有一人准确指出了一名高风险患者。事实上,情况转坏的患者总共有40人。

在格蕾丝去世后,又过了几年,我开始治疗一位名叫茱恩(June)的患者。那时,我已经开始在治疗中运用FIT法。

当时,茱恩刚刚辍学,因焦虑、抑郁和社交孤立来寻求帮助。她告诉我,从小到大,她就被这些症状困扰。她仍和父母住在一起,而父母是宗教原教旨主义者,控制欲极强。

刚开始,一切似乎都很顺利。茱恩腼腆、安静,从不与我发生眼神接触。对于缓解焦虑的技巧,她似乎表现出强烈的兴趣,还告诉我,每次回去都会练习这些技巧。每次治疗结束时,我都会向她寻求反馈,而她每次都会说,治疗很有帮助。

度量标准的采用显著提升了心理治疗的有效性,包括降低退出率,缩短治疗时间。

每次治疗前,茱恩都会花几分钟完成FIT问卷,对“我感到害怕”、“我很享受闲暇时光”等语句作出回应,预设答案代表了不同的程度,从“从不”到“几乎总是”。虽然每一次的问卷结果都在我手头,但我一直没有去看,因为她的状况看上去不错。

几次治疗下来,我终于打开了那些图表,更多地是迫于义务,而不是真心觉得有用。我吃惊地发现,茱恩的图表上显示出红色预警信息。从治疗开始至今,她的症状根本就没改善过。算法报告称,她面临极高的恶化与自杀风险。

面对警告,我的本能反应是,这怎么可能?肯定是软件出错了,我心想。茱恩一次又一次地告诉我,治疗很有效。之后一次的治疗开始前,我询问了她的近况。她瞅着房间的一角,回答说,我教的技巧很管用。不过这一次,我继续追问:“技巧有效,这很不错,但你呢,你怎么样?”茱恩没有立刻回答,她开始变换坐姿,明显很不舒服。我的焦虑感也开始上升,但我抑制住了转变话题的冲动。“慢慢来,不急。”我说。

沉默良久之后,茱恩第一次看着我的眼睛,跟我说,“对不起,我觉得我都不如以前了。但我不想让你觉得是你的错。是我不好。你真的帮了很大的忙。”茱恩的情况在恶化,要不是程序,我永远看不到这个事实。

我的经历其实也是世界各地心理治疗师的经历。兰伯特的研究取得成功后,反馈系统大量涌现:过去二十年间,近50个这样的系统应运而生。随着这些系统的普及,它们收集到的临床数据也越来越多。研究显示,度量标准的采用显著提升了心理治疗的有效性,包括降低退出率,缩短治疗时间。还有什么可挑剔的呢?

很遗憾,在许多行业,度量标准都遭到了冷遇。心理治疗中的度量标准和反馈系统也遇到了同样的障碍。自从这一套体系问世以来,已经有几十项研究发布,来印证它的好处。然而,心理治疗师却迟迟没有跟进。

2003年,加州大学圣迭戈分校的安·加兰德(Ann Garland)在圣迭戈县进行了一项研究,他们在能收到疗效评分的治疗师中取了一个样本,结果发现,92%的人都没有使用这套体系。而2013年,纽约州立大学奥尔巴尼分校的詹姆斯·伯斯维尔(James Boswell)等人在一篇论文中指出,“横跨多国的调查显示,在日常工作中真正使用FIT法的临床医生少之又少。”

近些年的研究很少有涉及FIT使用情况的具体数据,但根据我自己的印象,时至今日,使用FIT法的治疗师依然少得可怜。在与同行的谈话中,我得知,之所以不采用,最普遍的原因是他们认为,量化数据不可能捕捉到心理治疗中的微妙之处,计算机就更别提了;在很多治疗师看来,心理治疗量化这个概念压根就是个错误。

这种观点的前半部分并没有错:单一的心理健康衡量手段无法鉴定出形形色色的心理疾病,就像体温计无法测出癌症、糖尿病或是心脏病一样。另外,FIT法也会给出假阳性和假阴性的结果,从而夸大或低估风险。但光凭这些理由,我们还不足以完全忽略数据,就好比体温计,它虽然不能作为一个人是否患病的最终依据,但还是能提供重要的信息。

我每天都要经历一场思想斗争,心底有一个声音对我说:对那些不符合自己假设或是预期的数据,干脆忽略好了,或者不要相信。

“新思路(当然是指实用的新思路)最普遍的特征之一,就是它们不完美。”历史学家A.J.杨森(A. J. Youngson)写道。FIT法的完善需要时间。最近的一项元分析显示,此类系统不会自动提升所有病人的治疗结果,只对那些有恶化风险的患者有效。(兰伯特先前就承认过这一局限性。)

当然,只有临床医生知道如何利用它来改进治疗方案时,这些度量标准才会发挥作用。若想更好地理解病人,收集心理治疗数据十分关键。但仅凭它,是无法治愈心理疾患的,就像把体温计放进病人嘴里,这个动作本身是无法治愈流感的。

不管是度量标准的惊人潜力,还是推行过程中的巨大阻力,罗比·巴宾斯-瓦格纳(Robbie Babins-Wagner)都深有体会。她是加拿大社区心理咨询机构卡尔加里咨询中心(CCC)的首席执行官。我曾听说,她一直站在FIT推行的最前沿,比其他人超前了十年。

1992年,CCC聘任巴宾斯-瓦格纳担任顾问主管,当时的她已拥有14年诊所经验。在改进CCC的过程中,她读到关于FIT法的介绍,于是她启动了一项计划,与员工协作,在CCC推行心理治疗的度量标准。

在为期四年的试行期收尾时,巴宾斯-瓦格纳将CCC收集到的数据进行了统计分析。虽然平均结果不错,但她发现,尽管中心要求所有治疗师都使用FIT,但实际上只有一半人在用。

治疗师最常抱怨的是,“数据是错的,你不能强制我们,我知道该怎么做。”巴宾斯-瓦格纳说,“意思是,我的直觉告诉我——我的治疗经验告诉我——病人怎么样,我最清楚。”

巴宾斯-瓦格纳听取了他们的顾虑,请他们就如何改进度量系统提供反馈。她还澄清:疗效数据的收集并不是强制性的。过了几个月,四成的治疗师辞职走人。

然而,巴宾斯-瓦格纳毫不动摇,她的坚持终于得到了回报。威斯康星大学麦迪逊分校的西蒙·戈德伯格(Simon Goldberg)分析了CCC的数据后发现,诊所的疗效连续七年,每年都有小幅稳步提升。就我所知,这还是心理治疗领域中,第二次出现疗效逐年提升的现象。

尽管这些成果值得称道,但很多人还是很难去适应数据的使用。CCC心理咨询师米歇尔·基奥(Michelle Keough)告诉我,几年前,自己刚来这里实习时,对这个系统是很怀疑的。“对于怎么使用图表和统计数据,才能使患者受益,我有些忐忑。”她回忆说。她还担心,这可能会导致她与病人之间关系紧张,破坏医患关系。但渐渐地,她意识到,这套系统其实能改善沟通质量。“现在,离了它我都不知道该怎么办。”她告诉我,她手下的许多实习治疗师都有过类似的心路历程——从最初的担忧,到最后的接纳。

对于这种本能的抵触,我深有体会。看到自己的盲点被系统揪出来,心里总归不是滋味。往好了说是催人奋进,往坏了说就是丢脸。我每天都要经历一场思想斗争,心底有一个声音对我说:对那些不符合自己假设或是预期的数据,干脆忽略好了,或者不要相信。

我知道,让治疗师无视直觉、相信冷冰冰的数据,这很难;但通过亲身经历,我也明白,当治疗师不清楚患者的确切状况时,对患者来说,事情同样艰难。30岁出头那会儿,在我成为治疗师以前,少年时代的焦虑和抑郁再度袭来,我开始借助毒品来缓解这种情绪。当我意识到自己麻烦不小时,我又找到了当年对我很有帮助的心理学家,开始接受治疗。

但这一次,效果很不理想。就像格蕾丝找我治疗时一样,我不偏不倚,恰好落在了治疗师的盲点里。他没有采用度量体系,而且,即便我是吸了毒之后再去与他会面,他也从不会觉察到我的状况正在恶化。

幸运的是,在朋友的鼓励下,我开始寻求更有效的治疗。对于之前的治疗师,我曾经满怀怨恨,但如今,我开始谅解。我自己的病人中,有很多例恶化和退出也是我不曾料到的。作为治疗师,我们时时刻刻都得意识到,迷雾之中有很多我们看不到的东西;对于能弥补视野局限性的工具,我们应抱有开放的心态。

就拿茱恩的例子来说,度量体系和反馈系统也许给了她第二次生命。反馈程序就像心理学中的归航信标,让我注意到她的情况正在恶化。知道问题存在后,就可以对症下药了。征得茱恩同意后,我将其中一次治疗过程录了下来,并拿着视频去请教一位心理顾问:乔恩·弗雷德里克森(Jon Frederickson)。他是古典音乐家出身,30岁左右转行做了心理治疗。如今,已有几十年治疗经验的他,开始帮助其他治疗师提升疗效。

我们一起看了视频,弗雷德里克森指出了一些问题。比如他注意到,茱恩一直用手捂着胃部,表明她十分焦虑,以至于感到恶心。他还注意到,治疗期间,茱恩一直在练习我教授的技巧,但却从不说自己感觉如何。“你在不经意间和她形成了一种上下属关系,你扮演老师的角色,而她努力掩饰自己的症状,试图做一个好学生。”他解释说,“出于对你的尊敬,她没有将自己的不适感告诉你。”

我问,怎么才能帮到她,他建议我摆脱原先的权威角色,以平等的身份与茱恩交流,帮助她承认自己的痛苦和焦虑,而不是对我唯唯诺诺。再次见到茱恩时,我将弗雷德里克森的话具实以告,并询问她有何想法。她沉默片刻,脸上出现一丝淡淡的笑容。“他可能是对的。”她坦言。

我们说定,日后的治疗会更加关注她的焦虑感,并保持更加平等的协作关系。这对我们来说,都不太容易。茱恩总会不由自主地进入“好学生”的顺从角色,极力掩饰那些痛苦的症状,而我则常常忍不住教她更多的技巧,而不是仔细倾听。整个过程中,反馈程序起到了不可或缺的作用,让我们看到双方都容易忽视的问题。每当系统提醒我,茱恩的状况正在恶化或者面临恶化风险时,我都会将治疗过程录制下来,寻求更专业的意见,纠正自己的误区。

之后的一年里,茱恩的焦虑渐渐得到缓解。两年后,她从社区学院毕业。在最后一次治疗中,我问她,这场治疗下来,帮助她最大的是什么。“虽然离那么远,”她说,脸上带着腼腆的笑容,“但你看到了我。”说完,她凑过来,头一次跟我握了手。

翻译:雁行

来源:The Atlantic

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多