分享

临床观察性研究论文需要计算样本量吗?请看示范性案例

 妙趣横生统计学 2022-01-04

我们来基于更多的案例,介绍观察性研究的论文写作规范-STROBE声明

之前的内容中,我们已经给大家介绍了观察性研究写作规范---STROBE声明诞生历史,以及清单条目为什么别人一个小样本回顾性研究就能发表好论文?、也介绍了观察性研究如何撰写标题与摘要(临床观察性研究论文如何撰写标题与摘要?请看示范性案例)、以及如何撰写观察性研究的前言(临床观察性研究论文如何撰前言?请看示范性案例)等。

STROBE声明是用于加强观察性研究报告质量的国际性声明,它通过22个条目详细描述了一篇观察性文章中各要素的写作要点,旨在帮助文章作者规范写作内容、充分体现研究质量,辅助期刊编辑更准确地评价文章质量。

上一篇文章,我们已经介绍了观察性研究方法的上半部分内容临床观察性研究论文如何撰写【方法】?请看示范性案例),观察性研究报告中方法部分提供了研究实施的细节信息,可供读者判断作者开展的研究能否有效解决前言中所提出的目标或假设,并评估研究偏倚的大小。本篇文章将结合STROBE声明和案例对观察性研究的方法部分中有关研究变量、数据测量、偏倚和样本量计算的写作进行剖析(7-10条)。

对于这四个条目,STROBE是这么说的(第7-10条)

第一部分:定义研究变量


条目7:研究变量部分应明确定义结局、暴露、预测因子、潜在的混杂因素和效应修饰因素 (如果可能, 给出诊断标准)

案例一:Ambient air pollution and congenital heart disease: A register-based study

The five most frequent congenitalheart disease subtypes (Dadvand et al., 2009b), ventricular septal defect,atrial septal defect, congenital pulmonary valve stenosis, tetralogy of Fallot,and coarctation of aorta, were also included in the analysis. Further to these,all cases of our included congenital heart diseases were introduced to theanalysis as a separate outcome group (Pooled-cases). This resulted in eleven outcome groups for the analysis including pooled-cases, five ICD-10 classesand five subtypes of congenital heart disease for the analysis. Since caseswith multiple congenital anomalies were included in our study, some cases are included in more than one outcome group.

案例二:Fresh Fruit Consumption and Major Cardiovascular Disease in China
Dietary data covered 12 major food groups: rice, wheat products,other staple foods, meat, poultry, fish, eggs, dairy products, fresh vegetables, preserved vegetables, fresh fruit, and soybean products. Respondents were asked about the frequency of habitual consumption during the previous 12 months and chose among five categories of frequency (daily, 4 to 6days per week, 1 to 3 days per week, monthly, or never or rarely). In a sub sample of 926 participants, the survey questionnaire was repeated within ayear after the baseline assessment (mean interval, 5.4 months) in order toassess the reproducibility of the responses.

案例三:Congenital structural anomalies in offspring of women with epilepsy—a population-based cohort study in Finland

Only major congenital malformations were included in the analyses. Minor anomalies were excluded according to the exclusion list of EuropeanRegistration of Congenital Anomalies (EURO-CAT). If a child had more than onemajor congenital malformation of one organ system, those malformations weretreated as one outcome in the analyses by organ system (…). In the statisticalanalyses, factors considered potential confounders (可能的混杂因素were maternal age at delivery and number of previous parities.Factors considered potential effect modifiers(可能的效应修饰因素 were maternal age at reimbursement for antiepileptic medication andmaternal age at delivery.

The study sample was drawn from FHS Third Generation and OMNI 2 cohort participants who took part in an ancillary study to evaluate liver fat andfibrosis using VCTE between April 2016 and March 2019. The details of the FHSThird Generation and OMNI 2 cohorts have been published in detail。

对于研究中重点关注的任何疾病结局事件,应给予明确的定义和判断标准。这点在病例对照研究中的病例定义、队列研究的结局事件判定和描述疾病流行情况中均有体现。

首先,作者应定义所有的变量,包括结果、暴露,预测因子、可能的混杂因素及可能的效应修正。疾病结局需要对诊断标准进行充分详细的描述。如病例对照研究中的病例诊断标准,队列研究随访期间的疾病事件的定义和横断面研究中的普遍疾病的诊断标准。明确的定义和要遵循的步骤对于了解疾病情况非常重要。

其次,对于一些研究,“决定因素”或“预测因素”是暴露因素的术语,结果可称为“终点”。在多因素模型中,作者有时使用“因变量”作为结果,“自变量”或“解释变量”用于暴露和混杂因素。但后者不够精确,因为它不能区分暴露与混杂因素。

最后,如果很多变量已经测量过以及在早期探索性研究阶段分析过,建议考虑用附录,附加表或单独文献的形式列出每个变量的详细信息。建议作者展示所有被考虑用于统计分析的“候选变量”,而不是仅选择最终模型中包含的那些。

案例一来自一项新生儿注册登记研究(Register-basedstudy)。首先作者依据EUROCAT指导原则和ICD-10分类对先天性心脏病(结局事件)进行了分组,补充了不同先天性心脏病患儿结局的确定依据,并用列表清晰呈现了结局类型。STROBE声明也推荐作者在附录或用附加表格来报告所有用于早期探索性分析的候选变量,而不是选择性地报告最终模型中的变量。

案例二为探究新鲜水果摄入量与心血管疾病发病风险的关系需要获得研究对象详细的饮食情况(暴露因素)。为此作者描述了食物的分类和如何进行饮食情况调查,以便读者了解评估暴露的方式。

在描述研究因素和研究疾病关系时,应将暴露因素和可能的混杂因素、效应修饰因素单独进行描述,同时避免用模糊的概念来描述结局和暴露,如dependent variable描述结局以及用independent variable描述暴露和混杂因素,可改用endpointexposure/confounding variabledeterminantpredictor(案例三)

第二部分:数据来源和测量方法

条目8:数据来源/测量部分应描述每个有意义变量的数据来源和详细的测量方法,如果有一个以上的组, 还应描述各组之间测量方法的可比性。


案例四:《Habitual caffeine intake and the risk of hypertension in women》

Total caffeine intake was calculated primarily using US Departmentof Agriculture food composition sources. In these calculations, it was assumed that the content of caffeine was 137 mg per cup of coffee, 47 mg per cup oftea, 46 mg per can or bottle of cola beverage, and 7 mg per serving ofchocolate candy. This method of measuring (caffeine) intake was shown to bevalid in both the NHS I cohort and a similar cohort study of male health professionals(…). Self-reported diagnosis of hypertension was found to be reliable in theNHS I cohort.

案例五:Serum adiponectin is not associated with risk of colorectal cancer, Cancer Epidemiol

Samples pertaining to matched cases and controls were always analysedtogether in the same batch and laboratory personnel were unable to distinguishamong cases and controls”.

暴露、混杂因素和结局测量的方式会影响研究结果的信度和效度。测量误差和暴露/结果的错误分类会进一步增加因果关系的判断难度,甚至可能产生相反的关系。混杂因素经过统计学处理后,若存在测量误差,测量有误的那一部分混杂产生的效应仍然会歪曲暴露对结局的真实联系。然而,仅报告评估或测量方法的细节仍不足以确保数据的效度。此处要求所采用的方法应是已被验证且可识别潜在的偏倚。

在描述有关评估或测量的信度和效度时,应描述方法的细节并引用相关方法,如案例四。STROBE声明还建议作者给出估计的问卷信度和效度值,并可将其用于测量误差调整或灵敏度分析。此外,当某研究是建立在其他研究的数据基础上时,还应补充原始研究中收集这些数据的目的。

对包含实验室检测的研究来说,明确不同组间数据收集方式是否存在差异显得尤为重要。若病例组的检测先于或后于对照组,检测熟练度的差异可能导致组间检测偏倚的产生,此时可选择随机盲法的检测方法(案例五)。组间检测方法的差异和样品检测次数的差异同样也可产生偏倚。

第三部分:潜在混杂

条目9:描述解决潜在偏倚的方法

案例六:Prospective study of type 2 diabetes mellitus and risk of primaryopen-angle glaucoma in women
Detection bias could influence the association between Type 2 diabetes mellitus (T2DM) and primary open-angle glaucoma (POAG) if women with T2DM were under closer ophthalmic surveillance than women without this condition. We compared the mean number of eye examinations reported by women with and without diabetes. We also recalculated the relative risk for POAG with additional control for covariates associated with more careful ocular surveillance (a self-report of cataract, maculardegeneration, number of eye examinations, and number of physical examinations).

偏倚的存在使得研究结果系统地偏离了真实情况。研究者在设计方案时就应认真思考可能产生的潜在偏倚并在撰写报告时指出研究执行过程中采取了哪些措施以控制偏倚。在报告中,STROBE声明建议作者讨论偏差的方向和大小,并在可能的情况下进行估计。在案例六中,参与者的监测差异可能导致偏倚的产生,因此作者提供了更多关于解决该问题而进行的分析细节。对于纵向研究来说,研究者应制定数据收集的质量控制计划以应对变量测量过程中的观察者偏倚或暴露因素随时间变化而导致的偏倚,并应在报告中予以说明。

第四部分:样本量

条目10:描述样本量的确定方法

案例七:《Maternal depression and low maternal intelligence as risk factorsfor malnutrition in children: a community based case-control study from SouthIndia


A survey of postnatal depression in the region had documented a prevalence of 19.8%. Assuming depression in mothers with normal weight children to be 20% and an odds ratio of 3 for depression in mothers with a malnourished child we needed 72 case-control sets (one case to onecontrol) withan 80% power and 5% significance. Epi Infoversion 6.04bwas used to calculate sample size .


样本量的大小将影响点估计的准确性和置信区间的宽度,影响研究结果能否有意义地回答研究假设/问题。大样本研究会让显著性检验更为敏感,可发现组间变量的细微差距,但这种差距有时对研究并无实际意义。小样本研究常能提供有具有探索性价值的信息,但较宽的置信区间限制了其证据质量,同时小样本研究常存在发表偏倚。

样本量的确定方法依赖于观察性研究的背景,故在设计方案阶段就应开始考虑。样本量的计算具有许多不确定性。例如对结局事件发生率的估计或某些重要参数通常需要做出假设。观察性研究中所需样本量与观察指标的性质、个体间变异程度有关,还与假设检验的具体内容以及III类错误、组间客观差异的大小有关,不同类型研究设计对样本量也有影响。而以上参数,多数能通过回顾同类研究或是小样本的预调查而获得。

案例七来源于一篇探究产后抑郁是否为儿童营养不良的危险因素的病例对照研究,作者首先介绍了当地产后抑郁的流行情况,并对发生产后抑郁的优势比、检验效能和检验水准作出假设,使用样本量计算软件得到所需的样本量。

观察性研究常常同时具有主要目的和多个次要目的,作者应指明样本量的计算是基于何种目的,若同时考虑多个目的,应指明最终的样本量是如何确定的。STROBE声明建议作者应尽可能报告计算样本量的过程中假设或确定的参数以及某些额外的影响因素。若研究因提前到达统计学显著性而终止,同样须加以描述。

对于观察性研究,郑老师我觉得这样做更合适:
(1)如果你是单枪匹马或者即便有,也只是小团队,你希望从临床上利用工作之机去收集临床样本去发表论文,我觉得一般来说,只要结果是阳性的,有统计学意义,不需要刻意计算样本量,毕竟这是是探索性研究。

(2)如果你要申报课题,或者毕业开题,你必须要想办法提供样本量的测算依据。

(3)如果你面对是一个现成的临床大样本量数据库,成千上万甚至更多的样本量,很多时候没有必要去算样本量,但是你可以测算另外一个指标,检验效能(Power),也就是在计算样本量我们经常设置的1-β值。因为,这个时候样本量已知,我们就要看看这样的样本量是否满足我们课题研究需要(一般1-β要0.8以上)。

那么,观察性研究样本量如何计算?放来看看郑老师团队制作的样本量计算器,它包括了病例对照研究和队列研究样本量--"浙中大样本量计算器".
这款高校老师制作的免费工具,手把手教你计算样本量!第2版出炉,新增4种算法!
本篇关于观察性研究方法如何写作就讲到这里,下篇推文我们将对统计学方法部分进行详细的解读,敬请期待!
本文作者:黄兴成,厦门大学公共卫生学院,在读学生。谢谢大家的支持。

更多信息

本公众号作为医学数据分析公众号,提供一些免费医学统计学学习资源下载,欢迎点击下载。
1.免费下载!统计初学者的福音!《妙趣横生统计学》视频,生动有趣的统计学!
2.样本量计算器,免费下载使用,手把手教你计算样本量!
3.绝对值得收藏!原创高清SPSS 操作视频免费下载
4.推荐!这个流行病大神制作的公共卫生研究小工具,可以计算标准化率及置信区间
5.全网最简单的SPSS教程,160页PPT学会SPSS统计分析!免费下载!
6.BMJ子刊教程“如何利用R语言进行meta分析”:附全套R代码
7.【免费】精制原创11讲短视频下载!零基础者2小时掌握医学统计学基本原理

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多