分享

ICH E9:临床试验的统计学指导原则(中篇)

 qpalzmxmcbv 2019-07-09

题记:本文是【人用药品注册技术要求国际协调会 ICH】三方协调指导原则中有关临床试验的统计学指导原则的中文版,因原文较长,我们将分三部分推送,以飨读者,以下为第二部分。

声明:本文版权归ICH 指导委员会。侵删!

ICH E9:临床试验的统计学指导原则(上篇)

3. 试验设计中需考虑的问

3.1 试验类型

3.1.1 平行组设计

最常见的验证性临床试验采用平行组设计(parallel  group design),即将个体随机分配到两个或多个组中的一组,每组分别施以不同的处理。这些处理包括药品的一个或多个剂量、一个或多个对照,如安慰剂或/和阳性对照。该设计所基于的假定与其他大多数设计相比要简单得多。然而,与其他设计一样,其他一些特性会使分析及解释变得困难(例如协变量、重复多次测量、设计因素间的交互作用、违背研究计划、中途退出试验及失访)。

3.1.2 交叉设计

交叉设计(cross-over designs)中的每个个体随机按两个或多个处理的不同顺序安排,是一种自身比较的试验方法。这种设计策略受到欢迎,主要是因为运用该法可减少观察例数,即达到指定的把握度所需的评定例数,有时减少的幅度还很大。在最简单的2×2交叉设计中,每个个体在相继的两个处理时期分别接受两种处理,两个处理时期之间常有一个洗脱期(washout period)。最常见的扩展是在n(>2)个处理时期接受n个不同的处理。在这类设计中,每个个体都接受了n(>2)个处理,这类设计有多种变异可分解,如每个对象所接受n(n>2)种处理的一个子集或者处理在一个病人身上重复的设计。

交叉设计有很多问题足以使其结论无效。主要的是延滞作用(carryover),即每个时期的处理在后继时期中的残余影响。在一个相加模型中,不等的延滞作用将使处理间的直接比较产生偏倚。在2×2 设计中,从统计学上不能鉴别是延滞作用还是处理与时期的交互作用,且因为相应的对比是个体间的,故这两种效应的检验效能都不高。这一问题在高阶设计中不严重,但不能完全消除。

因此,在进行交叉设计时,最重要的是避免延滞作用。最好是在充分了解疾病与新药的有关知识的基础上有选择地精心设计。所研究的疾病应当是慢性病,且病人处在稳定期。药物的疗效需在处理期内完全发挥出来,洗脱期必须足够长,以使药物的作用完全消退。这些条件是否满足,要利用已有信息及资料在试验前确定。

在应用交叉试验时,还有一些问题需引起密切注意。最主要的是,当有病例失访时,分析和解释变得很复杂。另外,可能的延滞作用,对在后续的处理时期出现的不良事件,难以判断是何种处理所致。这一问题及其他问题在ICH  E4已有详细论述。交叉设计一般限于预期仅有少数失访的情形。

2×2 交叉设计的一个常用且满意的应用是,验证同一种药物的两种不同配方的生物等效性。在针对健康志愿者的特定应用中,如果洗脱期足够长,则对相应的药物动力学变量的延滞效应一般不大可能出现。然而,在分析时仍需在所得到的资料的基础上验证这一假设。例如,确认在每一个处理时期的开始无药物可检出。

3.1.3 析因设计

析因设计(factorial designs)是通过处理的不同组合,对两个或多个处理同时进行评价。最简单的是2×2 析因设计,将研究对象随机分配到两个处理,如A 和B的四种可能的组合之一,即只有A,只有B,A 及B,既无A 又无B。在很多情况下,该设计主要用于检验A和B的交互作用。如果样本量是基于检验主效应计算的,则检验交互作用的统计把握度就会低。当应用该设计检验A 和B的联合效应时,特别是欲将两者同时使用时,这一点需着重考虑。

析因设计的另一个重要应用是,当联合使用处理C和D 时建立剂量反应特性,特别当各自单独使用时某种剂量的疗效已事先确定时。选择C的m 个不同剂量(通常包括0剂量,即安慰剂),D的相同数目的n个剂量。全设计包括n×m个处理组,每个处理组接受一种不同的C和D剂量的组合。反应曲线的估计结果将有助于在临床上确定C和D的最合适的剂量组合(见ICH E4)。

有时,2×2设计可以用来有效地使用临床试验病人,通过与评价单一处理所需的对象数相同的例数评价两种处理的效果。已经证实,这一策略对很高的死亡率的试验非常有效。这一方法的效率及有效性在于没有处理A和B的交互作用,因此,A 和B对主要效应变量的效应符合相加模型,故无论有无对B 的附加效应,A的效应实际是一样的。对于交叉设计,需根据先前的信息和资料在试验前给出能够满足这种条件的证据。

3.2 多中心试验

应用多中心试验(multicenter trial)主要有两个理由。首先,多中心试验是被大家所接受的高效的评价新药的方法;在某些情况下,这是在有限的时间内搜集研究所需的足够的试验例数的实际方法。原则上,这类多中心试验可用在临床试验的各个阶段。它可能只有少数几个中心,但每个中心均有较多的试验例数;而对稀有病例,它可能有很多中心,但每个中心都只有少数几个病例。

其次,将一个试验设计成多中心(多个研究者)试验,可为研究结果的推广与应用提供良好的依据。因为,可能搜集病例的范围广,用药的临床条件广泛,试验结果对将来的应用更具代表性。同时,因参与的研究人员较多,为新药疗效广泛的临床评判提供了可能。这种试验在药物试验的后期将成为验证性试验,常包含很多研究者和试验中心。有时,为使新药的应用更具广义性(见词汇),试验可在一些不同的国家进行。

如果想要多中心试验被有意义地说明和外推,则研究方案实施的方式必须是清晰的,且在各中心是一致的。更进一步,样本量与检验效能的计算均假设各中心的处理间差异是相同的量的无偏估计。制订一个共同的试验方案,并以此指导整个试验,这一点很重要。方法应尽可能完全标准化。通过召开研究者的会议、试验前对人员进行统一培训、试验过程中加强监视,可以减少评定标准和方案的不一致。完善的设计应使各中心的各处理组的受试者的分布相同,完善的管理要保持实现这一设计目标。如果以后发现有需要检验处理效应在各中心是否齐同一致,则避免各中心样本数相差悬殊以及个别中心的样本数太少是有益的。因为,这样减小了在估计处理效应时各不同权重估计值间的差别(这一点对所有中心样本数均很少时不适用,此时中心在分析中不考虑)。如果事先没注意这一点,且同时伴有关于结果齐性的怀疑,则严重时,会使多中心试验的价值降低到不能认为申办者的结论提供了令人信服的证据的程度。

在最简单的多中心试验中,每一个研究者将负责一个医院收集的病例,所以,中心是由研究者或医院唯一确定的。然而,在很多试验中,情况要复杂一些。一个研究者要负责几个医院的病例收集;一个研究者代表几个医院的一组临床医生(下属的研究者),而每个医生负责从各自的或几个相关的医院收集病例。一旦对统计模型中关于中心的定义有疑问,则方案中(见5.1 节)统计这一节需给出明确定义(例如,按研究者、场所或地区)。在大多数情况下,用调查者定义中心还是满意的,ICH 指导中E6 提供了这方面的指导。如有疑问,则目的应是以使对主要变量测量值及处理效应有影响的重要因素达到齐同来定义中心。将各中心合起来分析的任何方法均需证明是合理的,并事先在试验方案中明确说明。但无论何时,应用该法必须对处理保持盲态,例如,在对资料作盲态核查时。

用于估计和检验处理效应的统计模型需在方案中阐述。首先,应当用一个考虑到中心间差异的模型研究主处理效应,但不应包含中心-处理的交互作用。如中心间处理效应是齐性的,则在模型中常规地包含交互作用项将降低主效应检验的效能。如中心间的处理效应是非齐性的,则处理效应的解释是有不同意见的。

在某些研究中,如每个中心均只有少数几个病例的大的死亡率试验,没有理由期望中心对主要变量及次要变量有什么影响,因为它们不像会表现出有临床重要性的影响。在其他一些研究中,可能一开始就意识到每个医院只有有限的病例数,在统计模型中包含中心的效应是行不通的。在这些情况下,模型中包含中心项是不合适的,而且,在这种情况下也没有必要按中心随机化。

如果每个中心均有足够数量的样本,而处理效应是阳性的,则将影响结论的广义性,一般均需检验各中心间处理效应的齐性。对每个中心的结果用图示方法,或用分析方法,如交互作用的统计意义检验,可检验出明显的非齐性。当运用这样一种统计检验时,必须意识到,一般在一个为了检出主效应而设计的试验中,把握度是很低的。

如处理效应非齐性,解释时必须非常谨慎,应力图从试验的管理或病例的特征等其他方面找到解释。这种解释通常会提示合适的进一步的分析和解释。如果无法作出解释,例如,处理效应的非齐性,由明显的量的交互作用(见词汇)所证实,则意味着需要用不同中心予以不同权重的另一种处理效应的估计,使处理效应的估计具有稳健性。尤为重要的是,需了解任何用定性的交互作用(见词汇)显示的任何非齐性的基础,而找不到合理的解释,可能需进一步的临床试验,直到处理效应被可信地估计出来。

至今,我们对多中心试验的讨论基于固定效应模型的应用。混合模型也可被用于探索处理效应的非齐性。这些模型把中心和处理-中心效应看做是随机的,这在中心数大时是特别适当的。

3.3 比较的类型

3.3.1 显示优效性的设计

从科学上讲,通过安慰剂-对照试验显示优于安慰剂,或通过显示优于阳性对照(active contral),或由剂量-反应关系证实效果是最可信的。这类试验称为优效性(superiority)试验(见词汇),除非有特殊说明,一般情况下,本指导中所述均指优效性试验。

对于严重疾病来说,如果已经由优效性试验证实存在一个很有效的治疗方案,而采用安慰剂对照,就有悖伦理。此时,应考虑合乎科学地采用阳性对照。用安慰剂对照还是用阳性对照应根据各个试验而不同。

3.3.2 显示等效性或非劣效性的设计

在有些情况下,所研究的产品与某处理相比的目的并不是为了证实优效性。这类试验根据研究的目的可分为两大类:一是“等效性”试验(见词汇),二是“非劣效性”试验(见词汇)。

生物等效性试验属第一类。有时,进行临床等效性试验是为了其他法规上的理由。例如,非专利产品与市售产品相比,当混合物不被吸收,血液中无法检出时,需要验证临床等效性。

用很多阳性对照的试验,来说明一个被研究的产品不比阳性对照差,这属于第二类。另一种可能是试验药品的几个不同的剂量与推荐的剂量相比,或与标准药品的几个不同剂量相比。这种试验的目的是同时显示所研究的药物的剂量反应关系,并且以研究的药品与阳性对照进行比较。

阳性对照的等效或非劣效性试验若同时用安慰剂,可以一举多得。例如,是否比安慰剂有效,从而说明研究设计是合适的;同时评价与阳性对照药物的有效性与安全性的相似程度。在使用阳性对照的等效性(或非劣效性)试验中,不与安慰剂合用或不用多个剂量,有很多众所周知的困难。这与缺乏任何判断内部有效性的尺度(与优效性试验相比)有关,从而使得证实外部有效性成为必要条件。等效性试验(或非劣效性试验)本质上不是保守的,因此,设计或执行中的许多缺点使之偏向于得出等效性的结论。因此,这种试验的设计和实施需要特别小心。例如,特别重要的是要尽量减少违反入组标准、依从性不良、退出、失访、数据缺失和其他与设计方案偏离的事件,也要尽量减少在以后分析中的影响。

阳性对照药物要谨慎选择,一个合适的阳性对照,应当是普遍应用的,其相应指征的效果已经由设计良好并且有很好资料的优效性试验所确定和定量,并明确其可以在认真设计的阳性对照试验中表现出相似的效果。为此,新的试验必须与前述有效性试验具有同样的重要设计特点(主要变量、阳性对照的剂量、合格标准等)。在这种试验中,阳性对照药清楚地显示了临床疗效,充分考虑到了与新试验有关的临床和统计实践的进展。

验证等效性或非劣效性的试验设计方案中,包括表述清晰、语意明确是极其重要的。在计划中,必须指定一个等效界值,这个界值是临床上能接受的最大差别,并且应当小于阳性对照的优效性试验所观察到的差异。对阳性对照的等效性试验,需指定上界和下界;对阳性对照的非劣效性试验只需要下界。等效界值的确定需要由临床上来认可。统计分析常基于可信区间的应用(见5.5)。对等效性试验应当用双侧可信区间,当可信区间完全落在等效界值之内,则推断为等效。在运作上,这一方法等价于同时进行两个单侧检验,以检验(复合的)  备择假设为处理效应的差别在等效界值之外,或者处理效应差别在等效界值之内。

因为这两个无效假设是非联合的,用这种方法,I 类错误可以很好地被控制。对非劣效性试验应当用单侧区间。可信区间方法检验的无效假设为处理效应之差(被研究产品与对照之差)的等效下界相等,被择假设为处理效应之差大于等效下界的检验相同的单侧检验。I类错误的选择应当与使用单侧或双侧检验分开考虑。样本量的计算应当依据这些方法(见3.5)进行。

基于观察结果得到研究产品与阳性对照没有差异的无效假设为无统计学意义而做出等效或非劣效的结论是不适当的。无论是处理组还是对照组,病例的脱落就是倾向于反应的缺失。因而,对全分析集的分析将产生趋于显示等效性的偏差 (见5.2.3)。在选择分析集时也有讲究。

3.3.3 显示剂量-反应关系的试验

新的研究产品的剂量-反应关系是一个在开发的所有各期用多种方法(参见ICH E4)都能得到答案的问题。剂量-反应关系的研究有多种目的,其中特别重要的有:确定是否有效;建立剂量反应曲线的形态和位置;估计适宜的最初剂量;确定个别剂量调整的最优决策;确定最大剂量,超过这个剂量不会有更多好处。为这些目的,需要有一组不同剂量,如果合适的话,包括安慰剂(零剂量)的观察资料。为此,参数估计,包括可信区间的构建,以及建立图形的方法将与统计检验同样重要。所用的假设检验方法必须适应剂量的自然顺序,或关于剂量反应曲线形状(如单调性)的一些特殊问题。拟选用的统计方法需在实验方案中详细说明。

3.4 成组序贯设计

成组序贯设计是一种方便的进行期中分析的方法(见 4.5)。尽管成组序贯设计不是唯一的可用于期中分析的方法,但它应用得最广泛。因为,在试验中对某时间段中成组病例试验的结果进行评价比连续性对获得单个病人数据就进行评价更可行。统计学方法必须事先说明关于处理结果和病例所指定的处理(如破盲,见 4.5)信息的可获得性。一个独立的数据监视委员会(见词汇)将负责对成组序贯设计试验中的资料进行期中分析(见 4.6),该设计不但已被广泛、成功地应用于大型、长期的死亡率观察试验或非致命结果的观察,而且它在其他方面的应用亦越来越广泛。但特别是已经认识到在所有试验中必须监视其安全性,因而包括安全性的原因而提早终止试验等正规的程序,都应当考虑到。

3.5 样本量

临床试验中所需病例数必须足够多,以确保对所提出的问题给予一个可靠的回答。样本大小通常以试验中的主要目标来确定。如以其他基础来确定,则需讲清楚并且依据合理。例如,回答安全性问题或重要的次要目标所需样本量,要比回答主要目标所需样本量大(见ICH-Ela)。

用通常的方法确定适宜的样本量,需要确定如下各项:主要变量、检验统计量、无效假设及所选剂量(包括对所选剂量和所选病例总体要检出或拒绝的处理差异的考虑)的被择工作假设、错误拒绝无效假设之概率(Ⅰ类错误)、错误地不拒绝无效假设之概率(Ⅱ类错误),以及相应的对停止治疗、违背研究方案的处理方法。在有些情况下,事件率是估计把握度的主要变量。因此需要作一个假定,从所需的事件数外推试验最终所需的样本量。

计算样本量的具体方法,以及计算时所需的所有统计量之估计值(如方差、均值、反应率、事件率、待检差值),需在试验方案中给出,亦需给出这些估计值的依据。研究样本量对各种偏离假定的敏感性(sensitivity)是非常重要的。一个简单的方法是针对假定的一合理的偏离范围提出样本量的范围。在验证性研究中,样本量的确定主要依据出版物上的资料或预试验的结果来估算。要检出的处理差值可基于对在处理病人时与临床有关的最小效果的判断,或者基于新疗法的预期效果的判断,这比较大些。通常I 类错误概率设在5%或者更小,或者由多重比较考虑所需要的调整来决定;精确的选择可能受到所检验的假设和所期望的效果的影响。Ⅱ类错误的概率通常在  10%~20%;申办者的意愿是使这一数字应尽可能地低,特别是试验很难或不可能重复时。也可能采用通常的 I、Ⅱ类错误数值外的数值,有些情况甚至更好。

样本量的计算要参照主要分析所需的病例数。如果这是“全分析集”,则所估计的样本量需要比符合方案集(见词汇)小。这是因为考虑到退出处理的病例或者依从性差的病例会冲淡处理的效应。关于变异的假定亦需加以修订。

等效性或非劣效性试验(见 3.3.2)的样本量的估计,通常应得到处理差异的可信区间的目标。这一可信区间显示处理效应的差异最多到一个临床上所能接收的最大差异。当等效性试验的检验效能是以真实差别为0估计时,如果差值不为0,则往往低估达到这一把握度所需的样本大小;当非劣效性的试验的把握度是以0 差值估计时,当试验药效低于阳性对照时,也会低估了达到这一把握度所需的样本大小。选择或确定“临床上可接受的差值”要按照对将来病人的意义来证明其合理性,且可能小于上文中确定差异存在的优效性试验中所确定的“临床上有关的”差值。

成组序贯试验中的样本量在试验前无法确定,因为其值依赖于机遇的作用并结合所选择的试验结束规定及真实的处理分布,常常包含在期望的和最大的样本量之中。

当事件发生率比预期的低,或变异比期望的大,则无需揭盲的资料,亦无需对处理进行比较,即可重新估计样本量。

3.6 资料的搜集及处理

从研究者到申办者,数据的收集和传送可有通过多种媒体,包括病例记录表、远程监测系统、医学计算机系统和电子传输器。无论采用何种方式收集数据,资料的形式和内容必须与研究方案完全一致,且在临床试验前就要定下来。

从参数收集到数据库最终完成,应当集中在实施预先计划的分析所需的数据,包括确定对计划的依从性或识别违反方案的前后关系的信息(如有关服药的时间)来判定。缺失值(miss-ing value)需与“0值”和空缺相区别。

从数据获得到数据库完成的过程应该按照GCP(ICH E6,5)规定执行,尤其是及时可靠的数据记录、错误更正和补遗是建立高质量数据库,通过完成分析计划达到试验之目的所必需的。

4. 进行试验所需考虑的问题

4.1 试验监视和期中分析

按照试验方案认真进行临床试验,对结果的可靠性有着重要的影响(见 ICH E6)。认真进行监视能及早发现问题,并使问题的发生和再现达到最小。

在由制药企业发起的验证性临床试验中,有两种不同的监视方法。一种监视类型是监视整个试验的质量,另一种涉及揭盲以进行处理的比较(即期中分析)。这两种类型的监视方法,除人员职责不同外,所用的数据类型和信息也不同,因而用在控制可能的统计学和操作上偏倚的原则也不同。

为了了解试验的质量,对试验管理的监视应包括研究是否按计划进行、增加的数据的质量如何、是否达到了预期收集的数量目标、设计的假设是否合适,以及保持病人在试验中是否成功等(见4.2~4.4)。这类监视既不需要比较处理效应的信息,也不要数据揭盲,所以对I类错误没有影响。为达到这一目的而对一个试验进行监视也就是试验申办者的职责(参见  ICH E6),它可由试验申办者或由试验申办者指定的独立小组完成。这种监视一般从研究地点的选定开始,到最后一位病人数据的收集和清理结束。

另一类试验监视(期中分析)涉及到处理结果的比较。期中分析需要对指定的处理组(实际处理的指定或组的指定标识)揭盲,以及对比处理组的小结信息,这需要方案(或初步分析前的修订方案)中包含期中分析的统计分析计划。初步分析前应修订方案以防止某些偏倚。这将在4.5和4.6讨论。

4.2 入选标准与排除标准的更改

入选标准与排除标准在试验对象选择的全过程中应按试验方案中的定义保持不变。但有时对其作些修改也是适当的。例如,在周期较长的临床试验中,从本试验之外或是对本试验资料的期中分析中不断获得的医学知识就有可能提示对纳入标准进行修改。此外,标准的修改也可能来自监视人员的发现。他们在监视中发现常常不能按纳入标准选择对象或由于太严格的纳入标准导致入组率非常低。标准的修改不能破盲,对所作修改应在修订方案中写明,其内容包括任何统计的后果(如不同事件发生率导致样本量的调整、或分析方法的修订、如按修改的纳入标准或排除标准进行分层分析等)。

4.3 入组率

在病人入组时间长的试验中,必须对病人入组率进行监视。如入组率远低于试验方案中预定的水平,则需查明理由,并采取相应措施,适当放宽纳入标准和降低其他方面的质量,确保试验的把握度。在多中心试验中,这些考虑适用于每一个中心。

4.4 样本量的调整

在时间较长的临床试验中,常有机会对原设计及样本量的计算中所基于的假设进行检查。如试验计划是较为初步的或者建立在不确定的信息上的,这种调整就尤为重要。在不破盲的情况下,对数据进行期中检查,可发现总反应方差、事件率或生存经历与期望不符,则应适当地修订一般假设条件,重新计算样本量,认证其正确性,并写入修订方案及临床研究的报告中。如果曾为控制I类错误及其可信区间宽度而采取某些措施以保持盲法及其后果,也需加以阐述。只要可能,在试验方案中要预计到是否有重新估计样本量的潜在需要(见3.5)。

4.5 期中分析与提早终止试验

任何在正式完成临床试验前为了比较关于处理组间的安全性或有效性的分析称为期中分析。由于这些比较的次数、方法及结果将对试验结果的解释产生影响,所有期中分析必须预先计划并在试验方案中阐明。特殊情况可能导致在试验开始时并未确定期中分析。在这种情况下,则应在揭盲分析比较处理资料前完成描述期中分析方案的修改试验方案。如果一个期中分析是为决定是否终止试验而设计,则它常采用以统计学监视计划为指导原则的成组序贯设计(见 3.4)。如果所研究处理的有效性已很清楚,或相应的处理效应之差不可能达到,或出现了无法耐受的不良反应,这种期中分析的目的是及早终止试验。一般来说,用为监测有效性而设定的界限早期终止试验(即它们更为保守)比用为安全性考虑而设定的界限终止试验需更多的验证。当试验计划或监测目标中包含了多个的终点,则这些方面的复杂性也需要加以考虑。

试验方案中应当写明期中分析的日程,或至少有关安排其进行的考虑,例如,如果要用可变动的α消耗(alpha spending)函数方法,需在试验计划或第一次期中分析前的修订计划中写明。试验的终止规则及其特性需在试验计划或修订计划中详细叙述。如果该试验有数据监视委员会,则这一材料需由数据监视委员会撰写或批准(见 4.6)。偏离计划常有使试验结果无效的可能性。如试验计划需要改变,则任何相应的统计方法的改变需尽早在修订计划中写明,特别应就由于计划改变而对任何分析或推断所产生的影响进行讨论。所选方法必须保证总的I类错误的概率得到控制。

期中分析的执行过程应是一个完全可信的过程,因为它可能包含了非盲态数据及结果。所有参与试验的人员,必须对这类分析的结果保持盲态。因为,提前知道结果可能导致他们对试验的态度改变,且引起新入组病人特征的改变或处理间比较的偏倚。这一原则可应用于除了直接参加实施期中分析的人员之外的所有研究人员和申办人员所雇佣的人员。研究者仅仅被告知是继续试验、暂停试验,或是对试验过程进行修订。

大部分验证安全性和有效性的临床试验,需完成计划的样本量。只有在遇到伦理方面的原因,或把握度不再是可以接受时,方可终止试验。尽管如此,大家已认识到,由于种种原因,在药物开发分析中由于各种理由也包括申办者可以查阅比较性处理的数据的需要,如要设计另外一个试验;另外,那些有可能出现严重威胁生命安全或死亡率的一些研究,出于伦理学考虑,对不断积累的比较性疗效结果进行连续性监视。在以上这些情况中,期中统计分析方案均必须在比较性治疗数据揭盲之前列入试验设计方案或在修订的设计方案中,以避免可能产生的统计和操作偏倚。对许多新药的临床试验,特别是与公众健康关系重大的新药,必须另外指定一个独立的小组负责监视关于安全性和有效性结果的比较,并明确其职责。这个组织常被称为独立数据监视委员会(Independent data monitoring committee,IDMC),或数据与安全性监视组(Data and safety monitoring board),或数据监视委员会(Data monitoring committee)。

当项目申办者担负起监视安全性和有效性比较的职责,并从而可获得非盲法比较信息时,需特别注意试验的完整性并且适当地管理和限制资料共享。项目申办者必须保证并书面记录内部监视委员会遵守了书面的标准操作程序,并保证保留该委员会包括期中分析结果记录在内的决策会议记录。

任何设计不良的期中分析(不管是否导致早期结束试验)可能使结果有误,所得结论缺乏可靠性。因此,应避免这种分析。如作了计划外的期中分析,在研究报告中必须解释其必要性,必需破盲的程度,提供可能导致偏倚的严重程度的判断,以及对结果解释的影响。

4.6 独立资料监视委员会(IDMC)的作用

(见 1.25 及 ICH E6 中5.5.2)数据监视委员会可由项目申办者组建,它的主要任务是不时对临床试验的进程、安全数据和主要疗效变量进行评价,建议项目申办者是继续修订,还是终止试验。IDMC应当有书面的操作规程,并保留每次会议的记录,包括期中结果,在试验结束时可供查阅。IDMC的独立性旨在它既能控制重要的比较试验数据的共享,又能防止因接触试验信息而可能对整个临床试验的完整性所产生的影响。IDMC 是独立于社会评论机构(Institu-tional Review Board, IRB)或独立伦理委员会(Independent Ethics Committee, IEC)的机构,它的成员中应有通晓包括统计学等有关相应学科专业知识的临床试验科学家。

当有申办者的代表参与组成数据监视委员会时,这些代表的作用应在委员会的操作程序中加以明确规定(如在关键问题上是否具有投票权)。由于申办者的人员能够获得非盲信息,因此,在委员会的操作程序中还应说明如何控制期中试验结果在申办者组织内的散布。

(未完待续)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多