医学研究中常见的样本量估算方法

漠水llo9ygesv9 2022-01-29

展开全文

样本量计算是科研设计中非常重要的一个环节，通过随机抽样技术来选择研究对象，确定多少样本量至关重要。样本量过少，可能会导致假设的问题无法回答，以至于整个研究功亏一篑；样本量过多，势必带来人力、物力、财力的额外消耗，产生不必要的困难和浪费。本文主要介绍与样本量估算有关的因素及样本量计算过程。1样本量估算需要考虑的因素

样本量是根据事先确定的因素来估算的，影响样本量大小的因素有很多，常见的有以下几种。

1.1假设检验的方向

研究假设是针对特定总体提出的、与主要研究目的有关的一种假定。例如比较两种药物治疗高血压的疗效，通常会事先假定两组药物的疗效无差异（通常称为无效假设），然后在此假定下，收集数据计算统计量和P值，判断当前数据结果是否支持这一无效假定，如果有足够的证据可以推翻无效假设，就可以接受无效假设的对立面——备择假设，也就是认为两组药物疗效有差异。

在研究假设中，不同的假设方向会影响样本量大小，一般可分为单侧假设和双侧假设。如比较A、B两种药物疗效，如果研究者不确定二者谁优谁劣，验证的是A¹B，这就是双侧假设。如果研究者很明确A的疗效一定高于B，或B的疗效一定高于A，验证的是A>B或B>A，这就是单侧检验。单侧检验和双侧检验所需要的样本量不同，一般单侧检验所需样本量低于双侧检验。

如果研究者有100%的把握认为关联只有一个方向，那可以考虑单侧检验，但有时即使研究者认为不可能出现双侧关联，结果往往仍会出乎其意料。所以比较稳妥的方法是采用双侧检验。但是一定要注意，使用单侧或双侧检验是事先确定的，而不是数据收集分析后才临时改变。

1.2一类错误和二类错误

任何研究，当根据数据做出结论的时候，总会面临一定的抉择错误。例如，研究服用塞来昔布是否导致心血管事件风险的增加，可以接受无效假设，认为二者无关联；也可以接受备择假设，认为二者有关联。不管做出何种结论，都有可能犯错误。如果实际上二者并无关联，而你做出了接受备择假设的结论，那就犯了假阳性错误（即本来是阴性结果而做出了阳性结论），这种错误也称为一类错误或I型错误（通常用α表示）；如果实际上二者是有关联的，而做出了接受无效假设的结论，那就犯了假阴性错误（即本来是阳性结果而做出了阴性结论），这种错误也称为二类错误或II型错误（通常用β表示）。

与二类错误有关的一个重要概念是把握度（power），把握度是指如果备择假设为真的条件下，统计学结论正确拒绝无效假设的概率。例如，如果塞来昔布确实增加心血管风险，统计学结果正确拒绝了无效假设（塞来昔布不增加心血管风险）的概率。把握度跟二类错误（β）正好是相对立的，所以通常表示为1－β。

在计算样本量的时候，必须考虑一类错误和二类错误（或把握度）的大小。不管是一类错误还是二类错误，设的越小，所需的样本量越大。很多情况下，研究者习惯将一类错误（α）设为0.05，二类错误（β）设为0.2（即把握度1－β设为0.8），但这并非一成不变，可以根据研究目的来调整。例如塞来昔布是否增加心血管风险的研究中，研究者考虑到该药研发期间的耗费，认为犯一类错误是很严重的，可能会使前期投入完全浪费，那么可以将α设的低一些（如0.025）。反过来，如果研究者认为心血管事件风险的增加是很严重的，因为这不仅是个人健康问题，还是公共健康问题，此时可以将β设的小一些（如0.05）。

1.3效应值大小

效应值就是总体中的关联强度，关联强度在不同研究中有不同的体现形式，如组间比较体现为组间差值，相关性分析体现为相关系数，logistic回归中体现为OR值，等。

一般来说，总体中效应值越大（如两种治疗方式的空腹血糖相差20 mg/dl，或幽门螺杆菌阳性对胃癌的OR值为2.5），所需样本量越小；效应值越小（如两种治疗方式的空腹血糖相差2 mg/dl，或幽门螺杆菌阳性对胃癌的OR值为1.2），所需样本量越大。

如何选择一个恰当的效应值是比较困难的，很多情况下，研究者并不清楚总体中的效应值到底是多少。但在计算样本量的时候，我们不得不事先假定一个效应值。如果研究者对所研究的效应值不清楚，可以查阅文献或咨询专家，必要时可以通过预实验来获得。

1.4其它因素

除上述几个主要因素外，还有很多其它因素也会影响到样本量大小，如组间比较时，变异（通常用方差或标准差表示）越大，所需样本越大；组间例数不等所需样本量要大于组间例数相等的情形；研究的混杂因素越多，所需样本量越大。

抽样调查中还需要考虑设计效率问题。设计效率值是指对于同一目标量，调查单位相同时，所考虑的抽样设计估计量方差与完全随机抽样设计（不放回）估计量方差的比值。设计效率值越大，所考虑的抽样设计的误差越大，表明该设计的效率越低。此时要想达到跟完全随机抽样相同的效率，就需要更多的样本量。抽样调查中，整群抽样的设计效率值较大，不少专家建议整群抽样设计效率值可至少应设为2，即对于整群抽样，至少需要2倍的样本量，才能达到与完全随机抽样相同的效率。2常见研究的样本量估算

2.1横断面调查的样本量估算

横断面调查大多是为了调查某疾病的患病率，其样本量的计算需要考虑该疾病的预期发病率，并指定调查的精确度d（研究者容许的偏离总体值的程度）。通常精确度可设定为预期发病率的百分比（如预期发病率为20%，精确度为预期发病率的10%即2%）。此时样本量计算公式为：

式中，Z1-α/2为标准正态分布下面积为1－α/2所对应的百分位数。p表示预期发病率。ε为预期发病率的百分比。

例1：某研究欲调查当地学龄儿童的龋齿患病率，为了调查方便，采用整群抽样的方法。研究者根据以往资料发现当地学龄儿童的龋齿患病率约为30%，现欲以95%的可信度，要求结果落在总体真实率的10%以内。共需调查多少儿童？

该研究中，p=0.03，ε=0.1，α=0.05，则Z1-α/2=1.96。计算结果如下：

对于整群抽样，通常需要考虑设计效率的问题，即通过上式计算出897例之后，还需要乘以设计效率值才能达到与完全随机设计一样的效率。假定本研究设计效率值为2，则采用整群抽样需要897×2=1794例。

2.2两组均值比较的样本量估算

两组均值比较通常需要事先获得两组均值和标准差，然后根据一类错误和把握度按下式计算样本量：

式中，和表示标准正态分布中对应1－α/2和1－β的百分位数。nc表示对照组例数，表示实验组均值，表示对照组均值，k表示实验组与对照组例数的比例，s表示两组合并标准差。可通过下式计算， s1、s2是两组的标准差，n1、n2是两组的例数。

例2：某研究欲比较两种药物治疗糖尿病的效果，研究者采用随机对照试验，拟将糖尿病患者分为样本相等的两组，分别采用两种药物进行治疗，以服药后空腹血糖值作为主要疗效指标。研究者通过以往文献获得两种药物的空腹血糖均值和标准差分别（8.06±1.82）和（7.23±1.52）mmol/L，据此计算出合并标准差为1.68。同时研究者设定α=0.05，并希望能有80%的把握发现两种药物的真实差异，该研究应如何确定样本含量。将相应的指标值代入公式，计算可得

即对照组需要65例，根据1：1分配，两组共需130例。

2.3两组率比较的样本量估算

两组率比较需要事先获得两组的预期率，然后根据一类错误和把握度按下式计算样本量：

式中，和表示标准正态分布中对应1-α/2和1-β的百分位数。nc表示对照组例数，表示实验组比例，表示对照组比例。k表示实验组与对照组例数的比例。

例3：续例2，假定研究者以空腹血糖疗效作为主要疗效指标，通过以往研究获得两组有效率分别为83%和71%。试进行样本含量估计。将两组率代入公式，计算可得

即对照组需要190例，根据1：1分配，两组共需380例。

2.4两组生存资料比较的样本量估算两组生存资料的比较需要事先获得两组的预期死亡风险、招募时间等，然后根据一类错误和把握度按下式计算样本量。

式中，λt和λc分别表示实验组和对照组的风险率，和分别表示实验组和对照组风险率的方差，其计算公式为：

其中，表示实验组或对照组的风险率，T0表示招募时间，T表示总的研究时间，T- T0表示随访时间。当服从指数分布时，风险率和中位生存时间可进行换算，风险率=ln2/中位生存时间。

例4：某研究采用完全随机设计，比较两种药物对肺癌患者生存时间延长的效果，研究的主要疗效指标是生存时间（月）。根据以往文献发现，两组的中位生存时间分别约为13和8个月。该研究预计招募受试者的时间为6个月，并随访30个月，并且研究者希望能有80%的把握发现两种药物的真实差异，该研究应如何确定样本含量。

本例首先求得两组风险率分别为=ln2/13=0.053，=ln2/8=0.087。据此可求得两组的风险率方差分别为：

据此可求得对照组所需样本量为：

即对照组需75例，按1:1的比例，试验组也需75例，两组共需150例。

本文主要介绍了几种常见研究类型的样本量估算过程，实际中一般可用统计软件代替手工计算，以帮助研究者更简便、快捷地计算样本量。比较流行的软件如PASS（Power Analysis and Sample Size），该软件几乎可以计算所有情形下的样本量。此外，还有一些线上计算样本量的小工具，如http://www./SampleSize/SSCC.htm，专注于流行病学研究的样本量计算，可以进行病例对照研究、队列研究等常见研究的样本量估算。

总之，样本量估算在研究设计阶段是非常关键的，不管是根据公式还是利用软件，计算本身是较为简单的。但最关键的不在于如何计算，而是要确定采用哪一公式来计算，这需要结合研究目的、研究类型、假设检验等综合考虑，然后根据事先获得的参数进行计算。

冯国双博士

资深统计学家

北京儿童医院

资深SAS统计分析师，目前为中国CDC副研究员，具有十多年的SAS统计分析经验。主编《医学案例统计分析与SAS应用》，《医学研究中的logistic回归分析及SAS实现》、《医学实验设计分析与SAS实现》等SAS专著，在国际国内杂志共发表专业文章50余篇。目前任'北京市免疫规划和疫苗评价专家委员会'专家委员、《中华护理杂志》、《中国艾滋病性病杂志》《山东大学学报（医学版）》审稿专家，《慢性病学杂志》编委等。在多家科研机构、学校院所等进行SAS或统计相关的培训和讲座，具有丰富的统计培训经验。

课程推荐

欢迎关注由法迈新媒体携手美国国际临床研究学院(AOCRS)推出“20天超级训练营|从实际案例系统学习临床试验前沿设计方法”系列录播课程。本次课程从2021年2月到5月特邀国际临床专家团队解析著名国际临床试验真实成败案例，讲解全球最前沿的国际临床试验设计方案，助您系统掌握国际临床研究设计的思维逻辑、实操流程和运用技巧，让你听完就能动手设计模拟方案。本培训系列告别复杂理论，基于通俗易懂国际临床真实案例分析，为你提供最强最佳的学习体验！

项目独特优势

从成败案例中找出新的免疫机理，从而找出免疫治疗最佳的适宜人群

从成败案例设计中解读，提炼最优质的临床研究设计方案

从成败案例中，探索未来癌症免疫治疗的新方向

最权威的FDA指导原则进行系统授课解读,让你的临床研究直达国际标准。

最前沿的临床研究设计让你享受国际临床研究设计发明专家最佳的实操学习体会。

用最生动的案例解读，让你完成临床科研思维的蜕变。

特邀国际专家团队介绍最前沿的癌症免疫临床试验设计方案，并使用原创发明人研发的软件系统模拟实操，让你听完就能动手设计模拟方案。2020年7月国家药品监督管理局药品审评中心发布抗肿瘤药物临床试验统计学设计原则(征求意见稿)介绍了袁鹰教授原创的波音设计,培训将系统介绍袁鹰教授原创的波音设计平台的各种软件实操流程和运用技巧。

本培训聚焦全球免疫治疗临床研究前沿，促进我国临床研究的发展。在未来研究设计中，探索生物标志物，探索最佳联合方案，改进试验设计，开展创新性的、更适合中国患者特征的临床研究，将为中国免疫治疗的发展开创一片新天地。

课程列表 & 教材书单&精选实操案例名单

训练营专家讲师团

袁鹰教授波音设计的原创发明人美国MD Anderson 癌症中心Bettyann Asche Murray 终身讲席教授，兼 MD Anderson 癌症中心的生物统计学系副主任

贝叶斯适应性临床试验设计的国际知名研究人员

已发表超过 100 篇有关创新贝叶斯自适应设计的方法论论文，包括早期阶段试验，无缝试验，生物标志物指导试验以及篮式和平台试验。其开发的创新设计被广泛用于制药公司，医学研究机构和美国国家癌症研究所。在《新英格兰医学杂志》，《临床肿瘤学杂志》和《临床癌症研究》等顶级医学期刊上发表了广泛的著作。他撰写的《I-II 期临床试验的贝叶斯设计》由 Chapman&霍尔/ CRC 出版社出版。于 2017 年当选为美国统计协会(ASA)研究员，并于 2008 年当选为 ASA 地区分会主席。是 MD 安德森癌症中心的数据安全监控委员会(DSMB)主席，负责监督 140 多个正在进行的活动随机临床试验。

罗晟教授

杜克大学临床研究所(DRCI)资深临床试验设计专家和临床方法学专家

杜克大学医学中心生物统计学和生物信息学正教授

2020年当选为美国统计协会(ASA)研究员(Fellow)

拥有美国约翰霍普金斯生物统计学博士学位，擅长设计和分析临床试验及观察性研究，使用纵向和生存分析数据进行动态建模，以及神经科学的统计学方法。专长于贝叶斯方法，自适应设计及决策，多模态数据统计模型与模拟。是NIH/NINDS授权的首席研究员（PI），负责项目包括：1、NIH/NINDS在研项目“具有多元纵向结果的临床试验的统计方法”，该研究致力于开发临床试验中复杂纵向数据的统计学研究。2、NIA资助项目“阿尔茨海默症的综合建模和动态预测”，通过使用丰富的多模式数据（临床，神经影像学和遗传学）开发阿尔茨海默病进展的新型预测模型。3、NINDS资助项目 “帕金森病临床试验：统计中心”，为NET-PD网络中的II和III期试验提供设计和分析。

罗晟教授主持多项临床试验的策略制定、试验设计和执行、数据分析和解读，长期参与NIH项目评审，同时担任多个期刊编委及审稿人，已在包括JAMA, JAMA-Neurology, Lancet 等知名生物医学杂志及JASA、Biometrics, Statistics in Medicine在内的知名统计方法学杂志发表SCI论文100余篇，培养多名博士研究生以及访问学者。参与了杜克大学临床研究培训中心在中国的培训项目，与国内医生开展多项临床研究合作。

何有文教授

美国杜克大学医学中心免疫学系终身正教授

主要专业方向为分子与细胞免疫学，专注于机体对肿瘤的免疫功能研究。现任Frontiers in Cell and Devel-opmental Biology 杂志Cell Death and Survival Section主编,Scientific Reports 编委。现任美国国立卫生研究院基金评审专家，美国卫生部国家疫苗项目特聘专家，以及30多种世界著名学术杂志如Nature, Science, Nature Immunology等的评审人。曾任中国医学科学院协和医科大学病原生物学研究所特聘教授，兼任广州暨南大学客座教授，中国医科大学客座教授。曾任世界著名生物学杂志Journal of Immunology 和Journal of Biological Chemistry 编委，Immunology, Cellularand Molecular Immunology编委。曾住世界著名细胞生物学领域杂志Autophagy副主编。何有文博士从事免疫学方面的研究34年，共在国际一流科学杂志发表文章125篇，总影响因子＞1000„何有文教授在2001年被美国癌症协会授予研究学者奖(Research Scholar Award) „何有文教授最近5年致力于肿瘤的临床免疫治疗，开展了高度个体化和精准化的脑肿瘤免疫治疗的临床研究并取得了突破性成果。

张晖教授

美国西北大学Feinberg医学院预防医学生物统计系的生物统计学正教授，兼任该院Robert H. Lurie癌症中心正教授和Mesulam认知神经科学与阿尔茨海默氏病中心正教授，现任美国统计协会西田分会主席 (2016-2019)

此前张博士先后在国内的南开大学和中科院上海生命科学研究院取得学士和硕士学位，后赴美于罗切斯特大学分别取得药理学硕士与统计学博士学位。长期从事临床试验的设计和统计分析，已领导团队完成80余个临床科研项目的数据管理和统计分析，长期担任St. Jude儿童研究医院临床试验方案科学评审委员会委员，西北大学Feinberg医学院临床数据监管委员会核心委员及科学评审委员会委员。基于长期的生物医学研究经历，尤其擅长于深入挖掘复杂的临床数据，应用合适的统计模型，寻找具有重要临床科学意义的结论。已在包括New England Journal of Medicine、Nature Immunology等知名生物医学杂志及JASA、 Statistics in Medicine在内的知名统计方法学杂志发表论文百余篇，专著章节3篇，所发表论文被引用4000 余次。长期为Journal of Clinical Oncology, Lancert Psychiatry等约20家杂志担任审稿人。曾多次受邀为美国联邦医学基金，荷兰卫生福利及体育部评审基金申请。