抓住那只害群之马|谁是更好的治疗师?
文:林秀彬
图:黄蕊
一、谁还不想把当事人治好呢?
上回说到了一个略微有点可怕的恶化比率——经验上看来,参加治疗的当事人可能有7%-10%的概率会恶化。
但是哪个治疗师如果发现了当事人恶化,难道还不干点啥么?
最不济转介好不好?
那到底为啥治疗师看起来什么都没做呢?
可能是因为——根本没发现当事人恶化了……
这个听起来就有点诡异了,尽管我们也都知道,当事人和治疗师可能评价“好没好”的标准也许不一样,但也不至于差的太离谱。
再者说,治疗师难道不是被训练发现当事人的问题的?当事人问题严重了难道还能发现不了?——还真就没发现。
Scogin等人(1996)就试了那么一试。他们让咨询师和当事人都来评判一下当事人好转了没有。
这么多期看下来,我觉得大家一般也能猜出来,研究者们的坏心眼很多时候都让参与者有一种不小心吃了苍蝇的尴尬感。
Scogin的这个设计就是典型的“坑人设计”——他们让治疗师和当事人都评价一下当事人的进展情况,结果也是理所当然的意料之外、情理之中(从这个角度看,高考语文作文的命题者也算是深谙科学研究的套路了)。有1%的咨询师认为自己的当事人恶化了,而9%的当事人认为自己恶化了。这就带来了一个悖论——咨询师和当事人方面必然有一个感觉不太准。
那么到底是谁不准呢? 按照我们的经验,这种专坑治疗师帮助治疗师自我认识的研究,Lambert大神是绝不会袖手旁观的。
于是他也的确不孚众望地出手了。为了不给留下任何侥幸的余地,他直接使用了治疗效果测量问卷(OQ-45)对治疗效果进行了测量——“你们谁都别瞎感觉了,咱们都用分数说话!”
Hannan、Lambert等人(2005)使用治疗效果量表的分数作为指标,结果发现治疗师的对当事人恶化的估计已经离谱到无可救药:在总共550个有效的当事人数据里面,治疗师只估计出了3个当事人恶化,而最终只命中了1个,也就是其实在预估的3恶化的当事人里面有2个并没有发生恶化。
通过量表监测的最终结果是——40个当事人恶化;治疗师预测91%的当事人进步了,而实际上只有40%的当事人改善。
更离谱的事情是,在研究之前,研究者已经作弊一般地告诉了治疗师们,一般来说,恶化率应该是在7%-8%的样子,可以以这个为前提进行估计。
然而治疗师似乎没太理会这个概率。(丹尼尔·卡尼曼诚不我欺,让人根据概率预测事件完全就是鸡同鸭讲,全人类都不可理喻地错的离谱)
五年后,Hatfield(2010)也步了Lambert的后尘,他们的研究结果并没比5年前好多少——当事人如果在治疗效果测量问卷(OQ-45)上面恶化了14分(对于OQ-45这个问卷,14分的意义就是发生了可信的改变,算是很大的分数差了),那么会有21%的治疗师察觉,并记录在案;如果当事人恶化了30分——这个数字说明当事人已经恶化的略凶残了——只有32%的治疗时会发现,还不到1/3……
二、我们的队伍里面,混进了一匹害群之马?
这么一个数字当然不能让人感到满意,问题是——到底是哪个混球把当事人搞恶化了?居然还连自己当事人恶化了都没发现?
他是谁!?
他在哪!?
要怎么找到他!
这些问题恐怕是任何一个老板都竭力想要搞清楚的,谁不想只把工资付给最有价值的员工呢?
其实科学家也特别想要搞清楚,于是他们尝试用不少的指标,想把这个很差的治疗师给捉出来——他们系统地尝试了治疗师的经验水平、治疗师取向、治疗设置(Blatt,Sanislow, Zuroff, and Pilkonis, 1996)、受训类别(临床心理学、咨询心理学、社会工作、婚姻家庭治疗)、受训水平(前实习期、实习期、实习后)、性别、主要理论取向(认知行为、行为、动力学、人本)( Okiishi, Lambert, Nielsen, Ogles,2003;Okiishi等, 2006)——这些变量都不能分辨出来哪个治疗师的治疗更有效。
唯一一能区分开的一点就是,一个有执照的治疗师(美国的执照体系)能够用更少的会谈次数获得积极效果(但是并不能让更多的当事人改善或者让当事人改善更多)。除此之外,以上变量在区分治疗师是不是有效方面都不太有效。
请允许我用人话重复一下上面的结论(科学家们不说人话这一点我已经无力吐槽了)——经验丰富的治疗师和经验不多的治疗师一样有效;实习生和有执照的治疗师一样有效(除了会谈次数上差了一点点);受临床心理学训练和咨询心理学训练以及社会工作、婚姻家庭的治疗训练的治疗师一样有效;不同理论取向、不同治疗设置的治疗师一样有效。
这问题就越发的严峻了!
如果是这样,难道是说,不同治疗师的治疗效果没差别?
换言之,每个治疗师都有60%的当事人好转,7%-10%的当事人恶化,而且大家都很难发现当事人恶化?
要真是这样,伟大导师马克思定要诈尸以表示庆贺:“祝贺心理治疗界率先实现共产主义”!
三、去看哪个治疗师,这是个问题
您想多了,诈尸这事儿不适合唯物主义的马老先生……事实上,治疗师之间的差别不仅存在,差的还不是一点点,看来共产主义依然任重而道远……
只不过是能够区分好的和差的治疗师的指标并不是上面这些。
Lambert的团队 ( Okiishi,Lambert,Nielsen,Ogles,2003;Okiishi等, 2006)的在一个大学的咨询中心开展了一个超大规模的研究,涉及了6年间7628个当事人的64103次会谈以及71个治疗师。他们将治疗师按照治疗效果划分出来最好的10%(7人)和最差的10%(7人),比较这14个人的区别。
大家可以猜猜看,这两端的治疗师能差多少?
结果看起来似乎还是可以接受——最好的7位治疗师有22%的当事人获得痊愈,而最差的只有15%;最好的治疗师的当事人恶化率是5%,而最差的那7位是11%。
然而,考虑到差了将近一倍的恶化率和7%的痊愈率,对于每一个当事人来说,这个选择就很明显了。(P.S.痊愈不是好转,60%这是好转率,当中包含痊愈以及未达到痊愈标准的,但是有所改善的全部当事人。)
可是,既然这7位表现这么差,为什么他们不去改进一下呢?去见见督导呀,多出去学习学习呀,甚至跟当事人谈谈也好,为什么你们老七位就这么扯我们后腿呢……
四、做不到,有做不到的“不得已”
为了回答这个问题【您专坑治疗师的好友Lambert(Walfish ,McAlister,O'Donnell,Lambert,2012)又上线了】。这次Lambert没有秀测量工具,没有秀统计方法,而仅仅问了咨询师一个异常简单的问题,也仅仅用了你能想象到的最简单的统计方法。
各位也不妨尝试回答一下这个问题:
“你觉得,跟你资历相当的咨询师相比,你的治疗水平应该排在什么位置呢?”
。
。
。
“想好答案了吗?”
“请允许我鲁莽地猜测一下,是在最好的那20%吗?”
“不是?”
“那一定在前50%。”
“如果还不是,我只能说——您太谦虚了。”
Lambert大神和他的小伙伴们(Walfish,McAlister,O'Donnell,Lambert,2012)对治疗师的自我评估偏差进行了研究,最后的结果真是“问世间尬为何物,直教人无法直视”:咨询师自评的平均值是前20%(标准差是9.06),换言之,平均而言,治疗师都认为自己的水平在前1/5;而一半的受调查者评价自己在前25%里面,没有任何一个参与人认为自己在50%以下。
读到这篇文章时,我只想说——Lambert大神,你可以真相,但是也没必要真相的这么彻底吧?
好在大神还是安慰了一下吾等受到10000点伤害的脆弱心灵,告诉我们对工程师、司机、以及医生的调查都得到了相似的结果(Meyer1980 Dunning,Heath, Suls, 2004)。可见这是人类共同的评价方式,治疗师们大可不必因此感到羞愧和郁闷。
但是这也告诉了我们,这表现不佳的老七位,并不是不希望自己表现好,而仅仅是不知道自己表现还不够好……
五、寻找更好的治疗师
上面我们说到的全部可以很简单地概括为——治疗师对当事人和自己的评价都不甚准确;治疗师的治疗表现差别很大,但是治疗师的经验、受训背景、理论取向甚至训练阶段都解释不了这种差别。
这就带来了一个现实问题——我们知道一些治疗师更有效,但是几乎所有治疗师都认为自己是那些更好的治疗师。(我相信这里可能会有一些文化差异,但是小范围的调查表示(Goodyear 2017),尽管中国被试表现出来一点区别,但是区别不太大。)
这种重大问题,必然是科学家们的攻关重点啊,科学家们是如何攻关以及攻关的结果如何?我们下回分解吧。
作者简介:
林秀彬:华中师范大学心理学院临床与咨询心理学在读博士
研究领域:心理咨询的过程与效果
黄蕊:哈尔滨工程大学应用心理学系硕士
研究方向:生涯咨询、焦点解决短程咨询、睡眠障碍治疗
参考文献
Blatt, S. J., Sanislow, C. A., Zuroff, D.C., & Pilkonis, P. A.(1996). Characteristicsofeffectivetherapists: Further analyses of data from the National Institute of MentalHealth Treatment of Depression Collaborative Research Program. Journal ofConsulting Clinical Psychology, 64(6), 1276–1284.
Dunning, D., Heath, C., & Suls, J.(2004) Flawed self-assessment: implications for health, education and theworkplace. Psychological Science in the Public Interest, 5, 69-106.
Hannan, C., Lambert, M. J., Harmon, C.,Nielsen, S., Smart, D. W., Shimokawa, K., & Sutton, S. W. (2005).A lab test and algorithms for identifying clients at risk for treatmentfailure. Journal of Clinical Psychology, 61(2), 155–163.
Hatfield, D., McCullough, L., Frantz, S.,& Krieger, K. (2010). Do we know when our clients get worse? Aninvestigation of therapists’ability to detect negative client change. ClinicalPsychology & Psychotherapy, 17, 25–32.
Meyer, H. (1980) Self-appraisal of jobperformance. Personnel Psychology, 33, 291-295
Okiishi, J. C., Lambert, M. J., Eggett,D., Nielsen, L., Dayton, D. D., & Vermeersch, D. A. (2006).An analysis of therapist treatment effects: Toward providing feedbackto individual therapists on their clients’ psychotherapy outcome.Journal of Clinical Psychology, 62(9), 1157–1172.
Okiishi, J., Lambert, M. J., Nielsen, S.L., & Ogles, B. M. (2003). Waiting for super shrink: An empiricalanalysis of therapist effects. Clinical Psychology & Psychotherapy,10(6), 361–373.
Scogin, F., Floyd, M., Jamison, C.,Ackerson, J., Landreville, P., & Bissonnette, L. (1996).
Negative outcomes: What is the evidenceon self-administered treatments? Journal of Consulting and ClinicalPsychology, 64, 1086–1089
Walfish, S.,McAlister, B., O’Donnell, P., & Lambert, M. J. (2012). An investigation ofself-assessment bias in mental health providers. Psychological Reports, 110(2),1–6.