分享

有对照的临床试验的意义

 醉牛988 2016-08-13

临床试验和医学本身一样历史悠久,因为新疗法对病人的疗效观察,是由最早的医师来进行的。过去累积的很多经验,是通过精明的观察者发现治疗后发生的变化。古希腊医学家希波克拉底的医书,记录了原始的观察和谨慎的推论,都是一些杰出的成就,根据观察和推论就产生了吗啡、汞制剂、奎宁、洋地黄的用途;在进行治疗时和停用后,比较了每个病人情况的变化。以同时代的物理、化学、生物学和生理学知识为基础的医学理论指导着治疗,而且经常使之误入歧途。而往往根据著名医师或教授的临床经验,就能决定如何用药和怎样施行手术。

尽管欧洲的科学思想和实验在16和17世纪已经有重大发展,但是直到1747年,才进行了第一次计划周密的有对照的临床试验。当时,苏格兰的海军外科医师林德进行治疗“坏血病”的古典比较试验。这是一种非常可怕的疾病,那时长期航海的人有四分之三死于坏血病。

林德在他的《一篇坏血病的论文》中描写了船上12名坏血病人的症状:牙齿发臭,皮肤很多瘀斑,疲乏无力,双膝软弱。船在海上漂流着。全体病人早餐吃糖粥,午餐常喝新鲜羊肉汤,有时吃布丁和糖水饼干。晚餐吃大麦葡萄干,大米饭加无核葡萄干,西米和葡萄酒。有两人遵医嘱每天喝四分之一磅苹果汁。两名病人每天三次饭前服25滴芳香性硫酸,用强酸性漱口剂含漱。另有两人每日三次空腹服两茶匙醋,并用醋加在粥和其他食物、漱口药水中使之酸化。病情最坏的两个人有僵硬(其他人没有这种症状),就把腿浸在流动的海水中。另外两个人,每天各两个橘子和一只柠檬。但他们多次贪婪地吃这些水果,连续吃了六天,把水果都吃完。最后两名患者每天三次服舐剂,它的成分有大蒜、芥末、秘鲁香油和没药胶;并服一种煎剂使每天通便三四次。结果是出乎意料的,吃橘子和柠檬的两个病人疗效,其中一人在第六天就重返工作岗位。那时他皮肤上的瘀斑还没有完全消失,牙龈也没有治好;但没有用其他药物,只用芳香性硫酸漱口,在这些病人获救并搭上另一只船以前,他已经恢复健康。 另一个人根据他的病情来说,健康恢复得最快,后来指定他护理其他病人。

这个简单的对照试验,发现了柠檬和橘子可以治愈坏血病。但直到40年后,当有海军元帅衔的贵族最后承认林德的著作时,柠檬和酸橙汁才供应给英国的海军。用这种方法,使长期远航的人们不再发生可怕的疾病。

第二种深思熟虑的方法――使用计数和进行小心的比较,是巴黎著名的“神宫医院”院长路易斯发明。他是当代伟大的临床医学导师之一。放血,和通便一样,已经是很多个世纪以来治疗很多疾病的标准疗法。路易斯在1835年研究了放血对78个肺炎病人、33个丹毒病人、23个咽喉炎病人的疗效。他发现放血和未放血病人在死亡率和病程方面,都没有什么差别,在不同病期进行放血的病人之间也没有什么差别。这个结果与当时正统的教条大唱反调,以致在巴黎医学界掀起了一场风波。甚至连路易斯本人也不敢承认他自己的成果,并且继续用放血来治疗一些疾病。然而,他的观察已导致越来越少的人应用放血疗法了。

路易斯评论他的“计数法”对评价疗法的作用时,中肯地说:“在不同的治疗方法中,如已注意到年龄、性别、气质和强弱的不同情况,通过谘问得知在这些情况下一种疗法比另一种能治愈更多个病人,这样就可能使我们自己相信在这些疗法中它是最好的。(按:这就是说,不管治了多少病人,只考虑已经医好了多少个病人。)但这种看法还要进一步斟酌。因为迄今这种疗法已完全不用或很少用,治疗的科学仍然是这样的不肯定;即使我们掌握的疗法是有用的,我们也不知道它的应用范围。……为了使计算能导致有用的或真正的效果,只考虑个人的缓解能力是不够的;还需要准确地知道:治疗是在疾病的那一期开始进行的;特别是我们应该知道这种疾病的自然进程,它们的不同类型,什么时候它会自然停止,病人在摄生方面有没有犯错误,以及其他特殊情况。”

美国医史学家史洛克指出,上述论点把数学方法引进到临床医学中来,并把它称为“医学方法上史无前例的最有意义的研究”。

大约十年后,路易斯的崇拜者,美国一位名叫巴列的医师,把现代的有对照的临床试验的大部分基本原则,系统叙述如下:“在治疗方法的研究中,有待比较的病人们必须有相等的地区、社会阶层等的分配因素;他们应该有明确的阳性的诊断;病例不能被选择;必须明确地规定。肯定的结果将与可比较的事实的固定一致特性成比例,与它们数量的多少成比例……不承认病理学和治疗学的各种法则,不管它怎么完整,也是能够改变的,或在一定程度上可缩小的,构成法则的基础的个别病例的彻底研究是必需的。”

在19世纪后期,一些内科和外科大夫(包括伟大的外科医师里斯特),应用了路易斯的计算方法和细致的观察,但经常只用于新疗法治疗的几组病例进行比较。这种方法只有用于差别很显著或用于死亡率很高的疾病(如脑膜炎和糖尿病)时,才是可行的。要证明青霉素治疗脑膜炎或胰岛素治疗糖尿病的效力,并不需要同时进行对照试验。

随着抗血清和疫苗的采用,曾做过很多同时观察治疗组和对照组的临床试验。但这些试验几乎全部都不能满足周密计划试验的现代要求。例如所用病例的数目往往太少;对照组和治疗组在年龄、症状或严重程度方面,往往是不能配对的;病人分入各组不是随机的;因为观察人员很多,所以观察或总结很难一致的方法。然而,由于试验的结果往往很好,所以感染的预防和治疗都有很大的进步。尽管根据错误的理由可以得出正确的结论,但是由于计划不周,还是有很多结果下不了结论。赖特拒绝用统计分析方法来检查他的临床试验结果,致使没有价值的菌苗疗法使用了40年之久。

20年代有两个大规模的试验,用单盲法试验免疫预防感冒的效力。自愿参加的大学生随机地分入治疗组(注射疫苗)和对照组(注射盐水)。学生们不知道自己是注射疫苗不是盐水(单盲),只有研究人员才清楚。大规模使用安慰剂是一个新的步骤。结果证明:治疗组的学生与对照组一样容易患感冒。大约在同一时期,对肺炎病人进行了大规模临床试验,结果证明新制成的抗肺炎血清是有效的。

医史学家布尔认为,1935年以来比从前做了更多的临床治疗试验。那一年,杜马克以百浪多息的形式引进了磺胺药,开始了对细菌感染有效治疗的时代。因此比以前任何时候都更需要进行试验。两年后,希尔出版了《医学统计学》第一版,书中明确地规定了各项法则,以及计划周密的有对照组临床试验的各项要求。

这本书已经出了第十版,它使医学统计工具完善化和为人们所接受;它防止和取消了医疗上的很多蠢事,而且明确地设计了很多有效的方法。

为什么设计周密的对照临床试验推迟了这么多年?早在9世纪,阿维森纳已经提出:必须比较相似病例组用不同方法治疗的效果。

希尔在他的历史性叙述中,提出了推迟的三个主要原因:①迷信权威和传统;②缺乏有效的药物;③医师和病人的关系。

迷信权威和传统  它是多个世纪以来对任何形式的试验起强烈阻碍作用的因素。推论是根据希波克底或盖伦提出的前提而产生出来的,并为大学教授们一再阐述。各种疗法被袭用,并从一本教科书转译到另一本书。为了维护一贯正确的祖籍,必须不能怀疑和不承认无知。而为了认识到需要进行有对照的试验,为了肯定经验常常是错误的唯一来源,就必须怀疑和承认无知。医师必须承认不知道是新疗法好,还是原来的疗法好。他必须愿意被证明可能是错误的。

缺乏有效药物  这极大地降低了试验药物和疗法的热情。人们往往乐意去显示新法有效,而不愿意去否定原已建立的方法。19世纪有机化学、生物化学和细菌学的发展,导致20世纪出现新产品,对它们需要进行准确的评价。而且已开始应用能准确评价的诊断工具。

医生和病人的关系  这是推迟进行临床试验的最主要原因。这个关系继续推迟进行准确的评价,并继续影响很多医生和群众。这个关系涉及伦理和道德的问题,需要详细地讨论。医生认为必须用最好的方法治疗病人,这是自然而正常的。病人需要有信心,这是事实。双方认为各种可用的方法都应该使用,如果停用可能有益的疗法,双方都会认为是不道德的。然而,还有人不愿意怀疑和不承认无知,不愿去承认新法不一定是好的。不愿去承认每一种疗法都是一种试验,包含有某种危险和一些好处。医生也不愿降低他在治疗病人方面的权威,因为大型有计划的有对照临床试验都要有很多医生参加,事先必须提出计划。即使是由一个机构进行的小型试验,通常也要由一组医生进行治疗,另一组不知道用什么方法治疗的医生去评价疗效,这就是双盲法。如果仔细地遵守这些方针,大多数困难是能克服的。

在仔细而公正地说明试验的性质、可能获得的益处和遇到的危险之后,应该让病人自由选择,自愿参加临床试验。必须使病人理解和自愿参加。例外的情况是:对于参加疫苗(如脊髓灰质炎或结核病的疫苗)试验的儿童可不必说明情况;为了试验精神药物、神经外科手术、休克疗法的效果,尽可能征得精神病院患者的同意。在上述情况下,必需征求父母或亲属的同意,也应该取得有关医师的同意。

在考虑过可能发生的危险和可获得的得益之后,只有当认为这种试验有充分的根据时,才开始进行试验。它必须是一种经过细心的动物实验而效果仍有疑问的疗法,在进行少数的初步的无对照的临床试验后显示有希望,但它的最终价值――权衡其利弊――仍然是有疑问的。

临床试验的道德学已经提出很多考虑和想法。康德在他写的《绝对的命令》一书中,曾提出一个指导原则:“每个人的寿终正寝都应受到尊重,违反属于他的作为人的尊严,为了一些外部的目的而把他仅仅作为一种手段来使用,都是犯罪的。”病人绝不能够被利用。

美国心脏病学家斯波迪克,把赖特和其他很多人的异议颠倒过来,他写道:“我认为,使用任何新疗法必须使病人有50%的机会受益是不道德的;任何新疗法受益机会更低可能是错误的,它必须被抛弃,实际上应被藐视。”

治疗组和对照组在医疗护理的所有方面都是相同的,而且都是最好的,其唯一区别是治疗组应用需要试验的疗法或药物。必须经常道德考虑病人的安全和健康,如果治疗已被清楚地证明是十分危险的,或是害大于利的,这个试验应该修改,或是放弃。

在设计和实施试验、解释试验结果的过程中,必须贯彻客观、无偏见和公正的原则。发明一种新手术、新方法、新药物的热情的研究者,并不能正确地评价自己的事业(比彻氏的评论很中肯地说明这一点)。假如结果有利的,由于制药公司都希望获得利润,所以也不能作出恰当的判断。

一位麻醉学的研究教授和医学伦理学评论家比彻氏的评论,十分清楚地阐明了双盲法试验在否定结扎胸廓内动脉使心脏获得新血液供应方面的价值。他写道:“一些有高尚动机的高级医师说过,他们永远不会以在任何病人身上进行假治疗(即安慰剂)。当然,假治疗必须在参加试验的病人完全同意下才能进行,病人们必须表示愿意在完成研究前,不去追问他们是否接受了完整治疗。说他永远不能参加这种“假治疗”的品格高尚的内科医师和外科医师的情况,无论如何都是值得仔细地考虑。他发明一种新疗法或新手术(在这里主观效应是特别重要的),都已经过他和他的同事和追随者做过几百次。正如最重要的任务会发生某些危险一样,大的手术常常有一定的死亡率。后来,一位同样品格高尚的研究者和一位医生合作,并得到病人的同意,进行一项经过适当设计的研究,它包括不多于25次假手术,以及25次完整的手术,共有50名病人参加。这位研究者发现,新手术的疗效并不比了假手术好,而且其疗效充其量也是暂时的。拒绝做这样一种使头脑清醒的研究、品格高尚的内科医师和外科医师造成了什么后果呢?那些接受他的新疗法的病人,既损失了大量金钱,又浪费了时间。他们得到的只是不适和痛苦,一些人还丧了命。那么,面对着失败,品格高尚的临床家们还能够去进行适当设计的研究吗?当我们拒绝给病人们进行适当的试验,当我们使他们继续遭受不适当设计的大治疗过程的危险时,这确实表明我们往往考虑实验动物的康乐更重于病人的幸福和生命。”

在19世纪,医师们和生理学家伯纳德已经慎重地考虑过,关于为了积累科学知识而进行试验的道德学,以及不准剥夺人权的原则。但是这些原则直到第二次世界大战后才正式宣布。为了造就德国的合格医师,纳粹在人身上进行了野蛮的、不人道的试验,导致医学界和法律界的人们深刻的反省,这是纳粹的暴行所造成的。1947年纽约堡法典和1964年世界医学会发表的赫尔辛基宣言,都是国际上系统阐述的保护措施和各种标准,以保证病人的幸福得到优先考虑,以及尽管治疗是行得通的,也要征得病人同意。

因为有些医师和许多公众都不能理解,并继续反对有计划的有对照的临床试验,所以值得引用英国医学研究会1962年发表关于这个问题的文件部分内容:“关于治疗或预防研究的对照组对象”。这个文件说:“近几年来,应用了有对照的临床试验,使治疗和预防都有很大的发展。过去只是等待一般经验的缓慢积累,以决定任何特殊措施是有利还是不利;而现在经常可以通过试验解决问题。在一定情况下试验不仅迅速地产生更准确的答案,而且也可以减少还未发现的副作用的危害。但是,这些试验只有在有几组适当的病人能够互相比较时才能进行,只有在医学界搞不清两种疗法或方案中那一种比较好的时候,才允许做这些试验。在这些情况下,如果一些病人愿意用以前承认是最好的疗法,另一些病人用新疗法,这是合情合理的。如果以前缺乏有效的疗法,在这种情况下应该向参加试验的病人解释清楚,并得到病人真正同意。

“这样的有对照的临床试验可以提高道德观念,但可能存在一些困难。一般说来,应该坦白地告诉参加试验的病人,需要评价两种不同的疗法,请示他们合作。偶尔,这样做是不允许的。例如,使可能患致命性疾病的患者对有效疗法产生怀疑,往往可能对他们是不利的;也可能产生一种怀疑,认为特殊疗法的任何效应都是暗示在起作用,这就可能要在试验中加上安慰剂,以便决定暗示是否起作用。因为有这些以及类似的困难,委员会坚持这种意见:有对照的临床试验应该经常是由一组研究者制订计划和管理的,永远不应由个人单独进行。毫无疑问中,参加这样的集体性有对照的临床试验的任一位医师,都有义务从试验中撤回病人,而且用他认为必要的任何疗法去治疗病人,他个人的意见应该是最符合病人利益的。“

在美国,当需要试验一种新药时,除了研究人员认为它不行,或根据他们的经验判断,认为它损害这些人的最大利益之外,美国食品与药物管理局都要求应得到受治疗者的同意。赫尔辛基宣言和纽伦堡法典已被用作指导方针。赫尔辛基宣言的陈述是:“如果有可能,与病人心理学取得一致,病人接受详细的解释之后,医师应获得病人自己的同意。在病人未成年时,应该由法律保护人表示同意;当病人已病入膏肓时,也应由法律保护人代替病人表示同意。

“为了获得新的医学知识,医师可以把临床与治病结合这种程度,只有用疗法对病人的疗效才能证明临床研究是正确的。”

著名的《新英格兰医学杂志》的编辑英格芬革,在关于病人通知同意参加试验问题的谨慎的批判性讨论中指出:完全理解临床试验的准确性质和危险的病人是很少的,但他强调说,应该避免象过去那样用蒙骗来征得病人同意。他敏感地说:“公众和医学界一样必须认识到:接受试验的病人得到真正的保护,取决于研究者的良心和怜悯。“

这里还有什么其他错误需要考虑吗?应用这种手段又能避免多少错误呢?看来它能发现自身中毒和病灶感染概念引出的大多数疗法的错误,并将限制这些错误继续起作用。希尔还和我们讨论有关手术的问题:“根据最站不住脚的证据,切除几千名学龄儿童的扁桃体是有道德的吗?为了这种疗法有没有价值,而进行有对临床试验难道是不道德的吗?”已经适当地测试了菌苗疗法对类风湿关节炎的疗效,但可惜是在使用了30年后才进行试验。正如已经详细叙述的那样,这个临床不能菌苗比盐水安慰剂更优越。

把胸腺肥大兼有轻度至中度呼吸窘迫的婴儿,随机地分入对照组和X线照射组已经证明是没有益处的,因为即使在10年之后也不一定出现那种罕见的甲状腺癌。手术使脑增加血液供应的不幸结果,似乎只应该用于治疗少数智力迟钝的小儿,却把几百名不是手术对象的类似病人进行了同时的对比手术。我们已经知道:实施得很好的双盲对照试验,是怎样揭穿了胃冰冻对治疗十二指肠溃疡是完全无效的。

药物的副作用造成了什么灾难呢?如果铊疗法曾经和较不方便的但容易接受的X线照射进行适当对比的话,用铊糊剂治疗头癣而引起中毒的小孩人数是可以减少的。二硝基酚治疗肥胖症的早期临床试验,没有同时进行的对照组。应用当代技术和适当比较的有计划的临床试验,几乎能发现二硝基酚的一些严重毒性反应,以及证明它对减轻体重是无效的。

关于反应停有一个真正的问题。在霍普金斯医院,由一位最著名的临床药理学家拉沙那主持,进行了一项比较反应停与巴比妥类镇静效应的、计划周密的有对照的临床试验。在几天的期间内,给予反应停可以诱导睡眠,其效力与巴比妥类相等,有同样多的副作用,其中没有一种是严重的。英国的一项研究得出相同的结论。也做了很多其他临床的试验,但他们几乎都是计划不周的或没有对照的,通常是由药厂主办的,只比说明书略好一点。回顾过去,显然因为反应停是在精神病院里长期使用的,所以它的作用应与已有药物长期服用的效果进行比较。这样做似乎就可以发现有些病人发生多发神经炎的倾向。但是必须承认,在50年代后期,大多数镇静药都没有进行这样的临床试验。各种药物一般都不在妊娠的雌性动物身上进行试验,以确定药物对其后代有没有影响。

早产儿吸入高浓度氧气而导致失明的晶状体后纤维组织形成,如果及早进行很有限的有对照的临床试验,那么失明将会减到最低限度。在流行了10年之久,帕茨和他的同事们做了这样的实验,清楚地说明这是容易发现的。问题是临床医师没有怀疑到早产儿可能有不同的反应。比彻叙述这个特别的试验如何说明一些情感反应,它们常常作为这些试验的结果而出现。在开始时,有关的一些医务人员把事实完全颠倒过来,他们否定了要设立对照组,并假定高浓度氧气有救命作用。但是到后来,当失明只发生在吸氧的早产儿时,那些用氧治疗早产儿的医生和护士就感到苦恼了。

另一方面,临床试验虽然是有价值的,但有很大的局限性;主要是在准确地查出两个治疗组疗效的小而十分重要的差别方面,有时会遇到不可克服的困难,以及评价发现罕见的副作用方面也很困难。评价长期应用抗凝血药的试验得不到肯定的结果,说明了存在第一种局限性。由于特异体质或超敏性产生的副作用在500个病人中才发生一次,说明存在着第二种局限性。这些反应有肢端疼痛、原发性肺高血压、血钙过多、亚急性脊髓视神经病,以及非那西丁引起的肾损害。比较不常见的第三个问题,可能是由于道德上的原因不能实行有计划有对照的试验。例如,当怀疑吸药是突然死亡的原因时,就不能用各种剂量的气雾剂去治疗支气管哮喘。

保护病人不受治疗的危害和副作用的下一个步骤,是早期


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多