配色: 字号:
第13.1章 如何选定试验设计类型并付诸实施
2017-09-14 | 阅:  转:  |  分享 
  
第13章如何选定试验设计类型并付诸实施所谓设计类型,就是因素与水平之间的一种结构关系,它不仅取决于形式,还取决于内容。从呈现因素与水平之间
关系的形式上来划分,设计类型可分为两类:第一类由横向与纵向交叉决定因素的水平特定组合(或称为试验条件或试验点);常用来安排较少
的因素。第二类仅由上到下一个方向展示每个因素及其水平,每一行上的全部水平构成特定的试验条件或试验点;常用来安排较多的因素。13.1
单组设计、配对设计和单因素K水平设计(K>=2)单因素K水平设计13.2有无重复试验的随机区组设计和具有一个重复测量的单因素设
计13.2.1无重复试验的随机区组设计13.2.1有重复试验的随机区组设计无重复试验与有重复试验的随机区组设计之间的区别在哪里
?有重复试验时,能更好地反映试验受试对象的“个体差异”的大小;有重复试验时,可以分析试验因素与区组因素之间是否存在不可忽视的交互作
用。13.2.3具有一个重复测量的单因素设计13.3平衡不完全随机区组设计与无重复试验的双因素设计13.3.1平衡不完全随机
区组设计实际问题:在某项试验研究中,当研究者希望用随机区组设计安排试验时,发现试验因素的水平数大于每个区组内可以容纳的受试对象个数
,应该如何处理?设计问题:这属于平衡不完全随机区组设计问题。应设法使每个区组内的受试对象接受处理的种数、在全部区组之间达到动态平衡
。设计特点:13.3.2无重复试验的双因素设计实际问题:在某项试验研究中,拟考察两个试验因素对定量观测结果的影响,每次试验均涉及
每个试验因素的一个水平,试验因素各水平组合条件下只打算做一次试验,何时可以这样做?设计问题:这属于无重复试验的双因素设计问题。两个
试验因素都与受试对象的分组没有直接关系,换一句话说,受试对象可以被完全随机地均分到两个试验因素全部水平组合中去,每个小组一个受试对
象。设计特点:每次试验涉及每个试验因素的一个水平,特定试验条件下的试验结果稳定性很高,即便进行多次重复试验,其试验误差极小,在专业
上允许的范围之内;两个试验因素的交互作用可以忽略不计。实际操作:将两个试验因素及其水平分别放置在横向与纵向上,任何一行与任何一列交
汇点就是一个特定的试验条件,各试验条件下只做一次试验。13.4无重复取样(试验)与有重复取样(试验)的拉丁方设计与交叉设计13.
4.1不可拆分的单个体型无重复取样的拉丁方设计13.4.2可以拆分的单个体型无重复取样的拉丁方设计13.4.3可以拆分的单个
体型有重复取样的拉丁方设计其他设计可以与13.4.2相同,仅行与列交叉处有两个或多个试验数据,例如,在表13-13中,从每只白兔身
上抽取的血样被均分成12份,用每种药物分别处理其中任意的3份,就属于“具有3次重复取样的可以拆分的单个体型拉丁方设计”。值得注意的
是,这里属于“重复取样”,而不应称为“重复试验”,因为样品来自同一个体,且在同一时间点上被观测。从统计分析角度看,有重复取样数据,
可以分析因素之间是否存在交互作用,同时,还可真实地反映出相同试验条件下的试验误差的大小。13.4.4多个体型无重复试验的拉丁方设
计13.4.5多个体型有重复试验的拉丁方设计在表13-14中,若随机抽取了每种种系的小鼠20只,再将它们体重由轻到重编号,每4只
编为一组,依次为第1组到第5组,分别放入每行的5列上,接受相应的处理,这就是具有4次独立重复试验的5X5拉丁方设计。当然,每行每列
交汇处至少应有两个不同的受试对象,才可被称为多个体型有重复试验的拉丁方设计。每行每列交汇处重复次数最好相等。13.4.6不可拆分
的单个体型无重复取样的2X2交叉设计13.4.7可拆分的单个体型有重复取样的2X2交叉设计在表13-15中,若每行上的样品可分成
4份、6份或更多的偶数份,则试验因素的每个水平就可作用于多份样品,这就形成了“可以拆分的单个体型有重复取样的2X2交叉设计”。13
.4.8单个体型有重复试验的2X2交叉设计以上两种情形,人们发现:独立的受试对象或样品数太少了,其结论的可信度将受到质疑。于是
,人们把受试对象或样品数乘以K(≥2)。当受试对象或样品数为偶数且大于4时,人们又常采取以下两种方式来处置它们。分别被称为成组2X
2交叉设计与配对2X2交叉设计。(1)不可拆分的单个体型有重复试验的成组2X2交叉设计(2)不可拆分的单个体型有重复试验的配对2
X2交叉设计13.4.9多个体型有重复试验的2X2交叉设计13.4.10拉丁方设计与交叉设计的特点(1)一般认为:一个试验因素
与两个区组因素之间的交互作用可以忽略不计;(2)在拉丁方设计中,三个因素的水平数相同,以试验因素的水平数为准;(3)在无重复取样或
试验条件下的试验结果必须具有高度的重现性,否则,必须进行重复取样或重复试验;(4)在生物体的活体试验中,若试验因素为“药物种类”或
“药物剂量”时,一般不宜采用“单个体型拉丁方设计或交叉设计”。13.5嵌套(系统分组)设计与裂区(分割)设计及重复测量设计13.
5.1嵌套(系统分组)设计(1)定义:在一个涉及两个或两个以上试验因素时,若这些试验因素具备下列两种情形之一,则称此设计为嵌套(
系统分组)设计:其一,试验因素存在自然属性上的嵌套关系;其二,试验因素不存在自然属性上的嵌套关系,但对定量结果指标的影响存在主次关
系。试验因素的个数≥2,试验因素之间要么存在自然属性上的嵌套关系,要么对试验结果的影响存在主次关系(应由专业知识为依据);不适合考
察试验因素之间的交互作用;次要因素的水平数可以不等(表13-18),次级因素的具体水平取值可以不同(表13-19)。13.5.2
裂区(分割)设计(1)定义:当面对涉及两个或两个以上试验因素的试验研究时,若这些试验因素具备下列四种情形之一,则称此设计为裂区(分
割)设计。第一,试验因素在施加于受试对象时存在先后顺序之分,可简称为“多工序的裂区设计”,如下例子。第二,试验因素的全部水平组合对
应的试验可在短时间内全部完成,但由于生产任务的需要,必须将此整体试验由不同的试验者在不同时间重复完成,可简称为“在时间上重复的裂区
设计”。【例子13-28】嵌套设计的第二个例子:在某项试验中,涉及药物种类和药物剂量,但试验需要在不同时间重复进行,显然,时间改变
是较慢的,而在每个确定的时间点上,药物种类与剂量的水平改变都是很方便的。若用大鼠作为受试对象,可选取来自大鼠的重要非试验因素作为子
区组因素,还可以不同天做试验作为大区组因素,将药物种类与剂量进行组合构成析因结构,在以天为大区组因素的各水平下,再以时间段和时刻为
两层子区组因素,按含区组因素析因设计分配大鼠。提示:本例中,“时间因素”有三个不同名称,即“日期”、“时段”和“时刻”,前者包含后
者,它们都可被视为“区组因素”,而真正的试验因素为“药物种类”与“剂量”。相当于把“药物种类”与“剂量”所决定的两因素析因设计分别
在“时刻”、“时段”和“天”上进行重复。表13-22中的每个数据代表一个平均值,统计分析时应给出全部原始数据。第三,试验因素的全部
水平组合对应的试验可在短时间内全部完成,但由于生产任务的需要,必须将此整体试验在不同地域上重复完成,可简称为“在地域上重复的裂区设
计”。提示:整块地被分成6大块;每块地自北向南(表中可理解为自上而下)又被分成3中块;每个中块再被随机地均分为4小块。“肥料”在小
地块上被随机化安排、“品种”在中地块上被随机化安排,而“品种”与“肥料”的水平组合在大地块上被重复。第四,有些试验因素的水平改变起
来很困难(或很浪费),另一些试验因素的水平改变起来很方便(或不浪费),则先安排前者,可简称为“节约材料型的裂区设计”。提示:在表1
3-24中,每一天,对应着一个完成的“双因素无重复试验(最好做几次重复试验)”,三天的试验,实际上是把一个完整的试验重复3批。(2
)裂区设计的特点第一,在一个涉及多个试验因素的试验研究场合中,试验因素分期分批进入试验过程,整个试验过程分为多道工序来完成,全部试
验因素在各个工序之间不重叠、不交叉;第二,在一个涉及多个试验因素的试验研究场合中,试验因素的全部水平组合所对应的试验能在段期(或小
地域)内完成,但整个试验必需在“时间”(或地域或空间)上重复进行。13.5.3重复测量设计(1)重复测量的定义在试验研究中,至少
包含一个“重复测量因素”,此因素通常为“时间”、有时为“部位”,即特定条件下的受试对象(动物或人或样品)将在“重复测量因素”的水平
改变的条件下被重复观测某一个或多个定量(或定性)指标的取值。根据整个试验中涉及的独立试验分组因素的个数K与重复测量因素的个数M,可
将其命名为“具有M个重复测量的‘K+M’因素设计”。(2)举例第一,具有一个重复测量的单因素设计;第二,具有一个重复测量的两因素设
计;每一行中的三个数据测自同一只大鼠,该资料属于具有一个重复测量的两因素设计。值得注意的是:若第1个时间点是用药前,则将该列数据作
为“协变量”的值更为妥当。具有一个重复测量的三因素设计;具有两个重复测量的两因素设计;具有两个重复测量的三因素设计;(3)重复测量
设计的特点:由于同一行上的数据重复测自同一个体,这些数据之间具有不相等的相关性。相邻列上的数据之间的相关性大于间隔较长的任何两列上
的数据之间的相关性。正是由于这一特点,使重复测量设计定量资料的统计分析变得复杂的多,需要假定数据具有某种特定的方差和协方差结构。S
AS软件中所假定的协方差结构有30多种。一般常选用其中最为常见的5种,并基于这5种模型,对数据进行分析,从中选择最合适的模型所对应
的方差分析结果做出解释和专业结论。13.6析因设计与含区组因素的析因设计及分式析因设计13.6.1析因设计(1)析因设计的定义
:由全部试验因素的水平组合决定试验分组数目,各组中至少有两个独立的受试对象且它们是被随机分配的;每次试验必然涉及任何一个试验因素的
某个水平且全部试验因素对结果的影响地位平等。满足这些要求的多因素试验安排方法被称为析因设计。(2)实际例子第一,2X2析因设计;第
二,2X6析因设计;第三,2X3X4析因设计一、析因设计的概述析因设计是一种多因素的交叉分组设计。它不仅可以检验每个因素各水平间的
差异,而且可检验各因素间的交互作用。两个或多个因素如存在交互作用,表示各因素不是各自独立的,而是一个因素的水平有改变时,另一个或几
个因素的效应也相应有所改变;反之,如不存在交互作用,表示各因素具有独立性,一个因素的水平有所改变时不影响其他因素的效应。二、设计特
点1.同时观察多个因素的效应,提高了实验效率;2.能够分析各因素间的交互作用;3.容许一个因素在其他各因素的几个水平上来估计
其效应,所得结论在实验条件的范围内是有效的。析因设计要求每个因素的不同水平都要进行组合,因此对剖析因素与效应之间的关系比较透彻,当
因素数目和水平数都不太大,且效应与因素之间的关系比较复杂时,常常被推荐使用。但是当研究因素较多,且每个因素的水平数也较多时,析因设
计要求的试验可能太多,以至到了无法承受的地步。正确应用析因设计析因设计各处理组间在均衡性方面的要求与随机设计一致,各处理组样本含量
应尽可能相同;析因设计对各因素不同水平的全部组合试验,故具有全面性和均衡性。析因设计可以提供三方面的重要信息:各因素不同水平的效应
大小;各因素间的交互作用;通过比较各种组合,找出最佳组合。析因设计也叫做全因子实验设计,就是实验中所涉及到的全部实验因素的各水平全
面组合形成不同的实验条件,每个实验条件下进行两次或两次以上的独立重复试验。析因设计的最大优点是所获得的信息量很多,可以准确地估计各
实验因素的主效应的大小,还可估计因素之间各级交互作用效应的大小;其最大缺点是所需的试验次数最多,因此耗费的人力、物力和时间也较多,
当所考察的实验因素和水平较多时,研究者很难承受。此设计还有3个明显的特点:(1)它要求实验时全部因素同时施加,即每次做实验都将涉及
到每个因素的一个特定水平(注:若实验因素施加时有“先后顺序”之分,一般被称为“分割或裂区设计”);(2)因素对定量观测结果的影响是
地位平等的,即在专业上没有充分的证据认为哪些因素对定量观测结果的影响大,而另一些影响小(注:若实验因素对观测结果的影响在专业上能排
出主次顺序,一般就被称为“系统分组或嵌套设计”)。(3)可以准确地估计各因素及其各级交互作用的效应大小(注:若某些交互作用的效应
不能准确估计,就属于非正规的析因设计了,如分式析因设计、正交设计、均匀设计,等等)。(3)析因设计的特点第一,试验因素的个数≥2;
第二,每个因素的水平数≥2且可以不等;第三,不同的试验条件数(或组合数)等于全部试验因素的水平数的乘积;第四,各试验条件下至少要做
两次独立重复试验;第五,全部受试对象被完全随机地分配进入任何一个试验条件组中去,各小组中的受试对象个数可以不等,但最好相等;第六,
试验时,任何一次试验都将涉及任何一个试验因素的某个水平,即全部试验因素同时施加;第七,进行统计分析时,假定全部试验因素对观测结果的
影响是地位平等的,即没有主次之分。由上述特点,决定了析因设计分别具有一个明显的优点和缺点。优点:可以分析每个试验因素的主效应和试验
因素之间各级交互作用的效应大小。缺点:总试验次数太多,试验费用增大且费时费力。13.6.2含区组因素的析因设计(1)含区组因素的
析因设计的定义在析因设计中,受试对象是被完全随机分配进入任何一个试验小组中去的,这就无法消除来自受试对象的区组因素对结果的影响。若
试验因素仍按析因设计去形成框架结构,但受试对象先按单一型或复合型区组因素形成若干个小组,属于每个小组中的受试对象在所考察的重要非试
验因素方面尽可能一致,每个区组中的受试对象数目等于试验因素的水平组合数(即试验组数)或是其倍数,再将各区组中的受试对象完全随机地均
分到全部试验组中去。这样安排试验和分配受试对象的方法被称为含区组因素的析因设计。(2)含区组因素的析因设计的特点具备析因设计的绝
大部分特点,仅受试对象的分配形式由完全随机分配变为“分层随机”。比相同规模的析因设计能够多考察一个区组因素对结果的影响,当这个区组
因素是此试验研究中的唯一重要的非试验因素(可以是多个重要非试验因素复合而成)时,其结果的可信度高于相应规模的析因设计。13.6.3
分式析因设计(1)定义在析因实验中,如果有理由假定某些高阶交互作用可被忽略,那么只有做同水平标准析因设计的全部试验点中的一部分,
就可以获得主要效应和低阶交互作用效应的估计值,这样的设计被称为析因设计,亦称为分数析因设计或析因设计的部分实施。(3)分式析因
设计的特点:①分式析因设计的水平组合数为相应的同水平析因设计的水平组合数的mk分之一(m为试验因素的水平数,k为试验因素个数);②
无法考察最高阶或次高阶以上的交互作用项的效应大小。13.7正交设计与均匀设计及反应曲面设计13.7.1正交设计(1)正交设计的
定义在安排多因素试验时,当任何两个试验因素的水平组合满足以下两个条件,就称这样的设计为正交设计。任何一个试验因素的不同水平出现的次
数相同;任何两个试验因素的水平组合所形成的数对出现的次数相同。(2)例子由此可知,所谓正交设计,实际上就是根据具体情况选择合适的正
交表来安排多因素试验,特别是把注意力放在表头的安排上,简称为表头设计;并将表中的“水平代码”转换成试验因素的“真实水平”。第一步,
根据实际情况决定选择某种规格的同水平正交表或混合水平正交表;第二步,根据专业知识和预实验结果,确定拟考察哪些交互作用项;第三步,进
行表头设计。可以自己查交互作用表来安排表头,也可以找到现成的表头设计,直接拿来用。当然,有时需要灵活运用现成的表头设计。第四步,将
所选定的正交表中安排单个因素的那系列“抽出来”形成一张简化的“正交表”,将简化“正交表”中的“水平代码”转换成各试验因素的“真实水
平”;第五步,按简化“正交表”的各行所决定的试验因素水平组合作为试验条件,在每个试验条件下进行一次或多次独立重复试验(如有可能,应
做足够多次数的重复试验);第六步,对所收集到的定量资料采用正交设计定量资料的一元方差分析或多元方差分析处理。(3)实例分析Ln(k
m),其中L表示正交表,n表示试验次数,k表示水平数,m表示正交表的列数,最多允许安排的因素个数与交互作用个数。(4)正交设计的特
点第一,由正交表挑出来的试验点(即多个试验因素的水平组合)在空间具有“均匀分散性”;第二,由正交表挑出来的试验点在统计分析时具有“
整齐可比性”;第三,某些好的为包括在正交表中的试验点,可以通过统计分析将其发现。优点:在试验因素之间的高阶交互作用可以忽略不计的试
验研究中,可以较大幅度地减少试验因素的组合数(注意:不能认为在相同试验条件下可以不做重复试验),同时,还能保证试验结果具有较高的准
确性。缺点:灵活性较差,试验因素的水平数不宜任意取值;在试验因素个数与水平数都较多时,所需要的不同试验点数目仍然较多,在实践中,有
时仍不便实施。(5)人们对正交设计存在的误区;使用正交表设计的最常见错误主要表现在以下三个方面:第一,在正交表各行所决定的试验条件
下不做重复试验,即便该条件下的试验结果很不稳定,也仅做一次试验。第二,将正交表各列全部放满了因素和交互作用项,也不做重复试验;第三
,有些试验因素之间存在不可忽视的交互作用,也对其视而不见,甚至使某些单个因素与某些重要交互作用重叠在某一列上。存在上述三种情形之一
的正交设计,其结论很可能是有问题的,有时甚至是错误的。13.7.2均匀设计的定义(1)均匀设计的定义约定多个试验因素的任何一种水
平组合称为一个试验点,则当多个试验因素的某些试验点在空间上分布非常均匀,且达到一定的“标准”时,就称由这样的一些试验点所决定的试验
因素的水平组合结构为一个均匀设计。这里所说的“标准”就是度量一个设计所决定的全部试验点在空间的分布是否均匀的“偏差函数”取值很小或
最小。一般来说,正交设计更严格一些,通常试验次数要多一些,统计分析较简单(通常可用正交设计定量资料的方差分析),结果比较稳定;而均
匀设计则稍宽松一些,通常试验次数很少,但统计分析繁琐且结果不够稳定,适合多因素多水平的筛选试验的场合用。均匀设计过程与正交设计过程
基本一致,即根据专业知识提出的因素与水平情况选择合适的均匀表,好在均匀设计不需要考虑将交互作用安排在哪些列上,因为在试验设计阶段它
无法考察交互作用,只能在作多重线性回归分析时,引入因素之间的交叉乘积项和因素的平方项来试探性地反映。所以,若仅从表头安排的角度看,
均匀设计其实比正交设计要来得容易,只要找到了合适的均匀设计表,将全部因素按使用表所指示的列按次序放在均匀表的表头上,将对应列上的“
水平代码”转换成“因素实际水平”,按行所决定的试验条件去进行试验即可。均匀表可以分为“同水平的均匀表”和“混合水平的均匀表”两大类
。Un(Pq)符号的含义是:“U”代表均匀(Uniform);“n”代表均匀表的行数或试验因素的不同水平组合数,即不同的试验点数
;“P”代表试验因素的水平数,即各列中不同的水平代码数;“q”代表均匀表的列数,即最多可安排的试验因素的个数。(2)均匀设计统计处
理对定量资料将采用多重线性回归分析来处理。(3)例子当然,若试验做起来不是特别困难或费用不是特别昂贵,最好能多做几次试验,可以选用
U12(33)均匀表或U15(33)均匀表。如果因素的水平数≥4,试验因素的个数≥3时,若用析因设计,其试验次数非常之多,实际工作者很难承受。此时,即使采用正交设计,一般来说,其试验次数也是比较多的,在实践中不易实现。而采用均匀设计,只要能找到相应的均匀表,问题也就迎仍而解了。在方开泰、马长兴著的《正交与均匀试验设计》的书末,附有较多的均匀表,而在他们的网页(http://www.math.hkbu.edu.hk/UniformDesign/http://www.math.hkbu.edu.hk/UniformDesign/)上有更多的均匀表可供选用。(4)均匀设计的特点第一,在一定程度上牺牲了“正交性”,而特别强调“均匀性”;第二,是多因素试验设计中所需不同试验点最少的设计类型;第三,因正交设计受到了破坏,需要采用多重线性回归分析处理资料。又由于需要探索性考察交互作用项和试验因素的平方项,可能导致全部自变量(原自变量和派生自变量)的个数超过试验点数,拟合多重线性回归方程时,只能选择部分自变量进入模型,选择方法不同,其结果也不尽相同,故多重线性回归方程不是唯一的,有时可能存在很多符合某些条件的多重线性回归方程,需要有一些公认的标准进行评价,方可从中找到最合适的,有时可能会出现“过拟合”现象,但真实情况可能并非如此。对于过少样本量下获得的均匀设计的试验与分析结果,下结论时应十分谨慎的态度。30
献花(0)
+1
(本文系勤悦轩首藏)