来自:lfl008 > 馆藏分类
配色: 字号:
临床科研中正确抉择统计学方法
2021-01-20 | 阅:  转:  |  分享 
  
1.1981年确定的国际通用的评价原则2.1997年TrishaGreenhalgh在BMJ上提出的证实诊断试验有效的10条问题
3.2000年Sackett在循证医学第二版提出的8条原则1.1981年确定的国际通用的评价原则1.1诊断性试验与
金标准盲法比较和评价1.2纳入研究病例的分析与评价1.3病例的来源和研究工作的安排是否作了叙述1.4诊断性试验的重复性
及其临床意义是否明确1.5诊断性试验所确定的正常值是否合理可靠1.6在一系列试验中该诊断性试验是否最正确1.7诊断性试
验的方法及重复性分析1.8诊断性试验的实用性如何2.1997年TrishaGreenhalgh在BMJ上提出的证实诊
断试验有效的10条问题Q1:Isthistestpotentiallyrelevanttomypractice?
Q2:Hasthetestbeencomparedwithatruegoldstandard?Q3:D
idthisvalidationstudyincludeanappropriatespectrumofsubje
cts?Q4:Hasworkupbiasbeenavoided?Q5:Hasexpectationbiasb
eenavoided?Q6:Wasthetestshowntobereproducible?Q7:What
arethefeaturesofthetestasderivedfromthisvalidationstud
y?Q8:Wereconfidenceintervalsgiven?Q9:Hasasensible"norma
lrange"beenderived?Q10:Hasthistestbeenplacedinthecont
extofotherpotentialtestsinthediagnosticsequence?
脑卒中患者生存质量的评定及研究现况随着WHO健康新概念的提出以及医学模式由生物医学模式逐渐
向生物-心理-社会医学模式转变,传统的评价指标体系仅关注生命的保存与局部躯体功能改善,而既不能表达健康的全部内涵,也未能体现具有生
物-心理和社会属性的人的整体性和全面性。随着疾病谱的改变,医疗的主要目标由急性传染病转向癌症、心脑血管等慢性病。这
些疾病较难治愈,很难用治愈率来评价治疗效果,用期望寿命、死亡率、生存时间等客观生命“量”的指标,由于成效递减规律,这些数量指标相对
比较稳定,所以有必要寻求更敏感的指标来反映不断变化的健康状况。假设检验结论的两类错误当p≤α时,做出“拒绝其无差别的假设,
可认为各总体间有差别”的结论时就有可能犯错误,这类错误称为第一类错误(typeⅠerror)其犯错误的概率用α表示,若α取0.
05,此时犯Ⅰ型错误的概率≤0.05,若假设检验的p值比0.05越小,犯第一类错误的概率就越小。当p>α时,做出“不拒绝其无差
别的假设,还不能认为各总体间有差别”的结论时就有可能犯第二类错误(typeⅡ)其犯错误的概率用β表示,通常β为未知数,但假设检验
p值越大,犯第二类错误的概率就越小注意:当认为干预有负影响时,应使用双侧检验法。除非你有非常可信的证据证明这种差异仅在一个方向存
在,否则,你需要用双侧检验法。(四)常用的假设检验方法计量资料的假设检验计数资料的假设检验等级资料的假设检验1、常用计量
资料的假设检验比较目的应用条件统计方法样本与总体比较例数较大u检验例数较小t检验两组资料的比较(完全随机设计)
例数较大u检验例数较小,来自正态分布且方差齐成组设计的t检验例数较小且非正态分布或方差不齐成组设计的秩和检验/中位数检验
统计学处理方法的选择单个自变量资料的统计学分析方法自变量因变量
统计方法属性属性卡方(χ2)检验二分
(属性)数值t-检验多分(属性)数值
方差分析属性数值(有截缩)寿命表法/积限法数值
数值回归(或相关)分析统计学处理方法的选择两个
或以上自变量资料的统计学分析方法自变量因变量统计方法属性
属性对数-线性属性或数值属性(二
分)logistic回归属性或数值属性(多分)判别分析属性
数值方差分析数值数值
多元回归数值或属性数值(有截缩)Cox回归属性(有
混杂)数值协方差分析数值─
因子分析或聚类分析1、常用计量资料的假设检验(续表)比较目的应用条件统计方法配
对资料的比较例数较大(任意分布)配随设计u检验(配对设计)例数较小,差值来自正态配对设计的t检验例数较小,差值为非正态
配对设计的秩和检验多组资料的比较各组均数来自正态分布且方差齐成组设计的方差分析(完全随机设计)各组为非正态分布且方
差不齐成组设计的秩和检验配伍资料的比较各组均数来自正态分布且方差齐配伍设计的方差分析(配伍设计)各组为非正态分布且
方差不齐配伍设计的秩和检验2、常用计数资料假设检验方法比较目的应用条件统计方法样本率与总体率的比较n较小时二项分布
的直接法np>5且n(1-p)>5二项分布的u检验两个率或构成比的比较(完全随机设计)np>5且n(1-p)>5二项分布
的u检验n>40且T>5四格表的X2检验n>40且12、常用计数资料假设检验方法(续表)比较目的应用条件统计方法配对四格表比较(配对设计)b+c>40配对X2检验np
>5且n(1-p)>5较正配对X2检验多个率或构成比的比较(完全随机设计)全部格子T>5或少于1/5的格子1的X2检验若有T<1或有多于1/5的格子1较(完全随机设计)多组比较(完全随机设计)两组比较的秩和检验多组比较的秩和检验配伍设计配伍设计的秩和检验配对设计符号
秩和检验四、变量间的相关分析数据资料的比较,是同一指标的不同处理组间的比较。在临床研究工作中,常常涉及疾病危险因素的研究和疾
病危险因素的探讨,即分析某个因素与疾病间的关系注意:相关关系并不等于因果关系1、常用数值资料的关系分析方法比较目的应用条件
统计方法两变量的依存关系正态单变量资料直线回归Ⅰ型正态双变量资料直线回归Ⅱ型两变量的相关关系正态双变量资料直线相
关两变量均不服从正态等级相关2、无序分类变量(计数资料)的相关分析前瞻性研究相对危险度(RR)归因危险度(AR)回顾
性研究比值比(OR)3、有序分类变量(等级资料)等级相关参数检验积矩相关系数(Pearson’sγ)非参数检验Spea
rman等级相关系数诊断性试验的研究与评价第一节诊断性试验研究的方法与评价条件一、确
定金标准诊断性试验的金标准(goldstandard)是指当前临床医师公认的诊断疾病最可靠的方法,也称为标准诊断。应用金标准可
以正确区分“有病”或“无病”。拟评价的诊断性试验对疾病的诊断,必须有金标准为依据,所谓金标准包括活检、手术发现、细菌培养、尸检、
特殊检查和影象诊断,以及长期随访的结果。二、选择研究对象诊断性试验的研究对象,应当包括两组;一组是用金标准确诊"有病"的病例组
,另一组是用金标准证实为"无病"的患者,称为对照组。所谓"无病"的患者,是指没有金标准诊断的目标疾病,而不是完全无病的正常人。病
例组应包括各型病例:如典型和不典型的,早、中与晚期病例,轻、中与重型的,有和无并发症者等,以便使诊断性试验的结果更具有临床实用价值
。对照组可选用金标准证实没有目标疾病的其他病例,特别是与该病容易混淆的病例,以期明确其鉴别诊断价值。正常人一般不宜纳人对照组。
三、盲法比较诊断性试验与金标准的结果评价诊断性试验时,采用盲法具有十分重要的意义,即要求判断试验结果的人,不能预先知道该病
例用金标准划分为"有病"还是"无病",以免发生疑诊偏倚。新的诊断性试验,对疾病的诊断结果应当与金标准诊断的结果进行同步对比,
并且列出格表,以便进一步评估,其方法如下。(I)用金标准诊断为"有病"的病例数为a+c;(2)上述"有病"的病例经
诊断性试验检测,结果阳性者为a,阴性者为c;(3)金标准诊断"无病"的例数为b+d,其中经诊断性试验检测阳性者为b,阴性者为
d;(4)列出四格表,将a,b,c,d的例数分别填入下列四格表(表1);如从论著资料中数据,不能列出四格表的诊断性试验,则无
法进行评价。表1四格表的排列金标准(诊断标准)合计有病无病诊断性试验+真阳性a假阳性ba+b_假
阴性c真阴性da+c合计a+cb+dn敏感度(sensitivity,SN)是正确诊断的真阳性病例在中风组中所占的百
分率,计算公式为:SN=a/(a+c)?100%特异度(specificity,SP)是正确诊断的真阴性部分所占百分率
,计算公式为:SP=d/(b+d)?100%准确性(accuracy,AC)反映了诊断试验结果与金标准试验结果的符合或
一致程度,计算公式为:AC=(a+d)/N阳性预测值(positivepredictivevalue,PPV)是诊
断试验为阳性结果中金标准证实患中风者所占的百分率,计算公式为:PPV=a/(a+b)?100%阴性预测值(negati
vepredictivevalue,NPV)是诊断试验为阴性结果中金标准证实未患中风者所占的百分率,计算公式为:NPV=d
/(c+d)?100%.阳性似然比(positivelikelihoodratio,LR+)为患中风组真阳性率和未
患中风组假阳性率的比值,计算公式为:LR+=SN/(1-SP),表明诊断性试验为阳性时患病于不患病的比值,比值越大则患病的概率
越大.阴性似然比(negativelikelihoodratio,LR-)为患中风组假阴性率与未患中风真阴性率
的比值,计算公式为:LR-=(1-SN)/SP,表明诊断试验为阴性时,患病与不患病时机会的比值.第二节诊断性试验的应用及其
临床意义1.ROC曲线ROC曲线(receiveroperatorcharacteeristiccurve)又称受试者
工作特征曲线,在诊断性试验中,用于正常值临界点的选择,对临床实验室工作尤为重要.诊断资料可以按资料的等级或性质归纳成2X2表(四
格表)或行列表。一般地说,如果诊断资料本身为二值变量,即诊断的结果为阳性和阴性,则归纳成四格表最合理。如果诊断资料为等级或连续变量
,归纳成四格表就会造成信息的浪费,这是,最好资料归纳成行列表,这样可以最大限度地利用信息。如果诊断实验的资料为连续变量,可以将资
料按一定的等级分级,归纳成行列表进行分析。表2CPK诊断心肌梗塞资料归纳表CPK(u)AMIAMI合计
有无>2809719880~2791181513340~791326411~3928890合计
230130360象这样的行列表,我们可以将其分割成表3形式的四格表,分别计算各指标,计算的结果见表3。表3各
种界值的阳性率及假阳性率由表3可见,灵敏度和假阳性率随界值的降低而生高,但特异度则随界值的降低而降低。根据这样
的关系,我们可以用假阳性率为横坐标,灵敏度为纵坐标做ROC曲线,见下图。指标(%)界值>28080~27940~79
1~39敏感度429399100特异度9988680假阳性率1012321001.0
0.90.80.70.60.50.40.30.20.10(特异度)1.0灵
0.9-〈=400.8-80-
敏0.7-0.6-度0.5-0.4
->2800.3-0.2-0.1
0曲线左上角灵敏度是1.0(100%),假阳性率是0,即所有的病人全部被确诊,所有无病者都不会误诊。距左上角距离越近的
曲线实验效果越好;在ROC曲线上,靠坐上角距离最近的界点作为界值最好。(Q:为什么?)在左上角处(灵敏度+特异度)/2的值最大
,可以根据此及实际工作的需要来确定具体诊断实验的界值。用ROC曲线可以比较不同诊断实验的优劣(Q:解释理由)。2.似然比的
临床应用似然比(likelihoodratio)是诊断试验综合评价的理想指标,它综合了敏感度与特异度的临床意义,而且可依据试验
结果的阳性或阴性,计算患病的概率,便于在诊断试验检测后,更确切地对患者作出诊断.真阳性率越高,则阳性似然比越大.表4AM
I患者CPK分层检测结果Q:某患者男性,40岁,活动后感胸前区疼痛,在医院查CPK为72u,问患AMI的可能性有多
大?(0.5,0.30,0.23)CPK(u)AMI(+)AMI(-)+LRn比例n比例>280
9797/230=0.4211/130=0.010.42/0.01=4280~279118118/230=0.51
1515/130=0.120.51/0.12=4.2040~791313/230=0.062626/130=0.20
0.06/0.20=0.301~3922/230=0.018888/130=0.670.01/0.67=0.01合
计230a/(a+c)130b/(b+d)第三节诊断性试验的评价原则临床科研中正确抉择统计学方法一、四个因素熟
悉和掌握下述四个因素是正确进行统计分析的基础(一)分析目的统计描述统计指标、统计图或统计表均数、标准差、率、构成比统计推
断(参数估计、假设检验)相关分析以相关系数来衡量各因素间的密切程度和方向回归分析研究某因素与另一因素的依存关系(二)资料
类型数值变量资料-计量资料无序分类变量资料-计数资料有序分类变量资料-等级资料注意:不宜将定量资
料转化为分类资料(三)设计方法每一种科研设计方法都有与之相适应的统计方法成组设计t检验配对t检验条件Logistic回归
非条件Logistic回归(四)数理统计条件数理统计与概率论是统计的理论基础只有当某个或某些条件满足时,某个数理统计统计公
式才成立涉及最多是数据分布特征其次方差齐性理论数大小二、数据资料的描述(一)数值变量资料的描述描述集中趋势的指标,用以
反映一组数据的平均水平描述离散程度的指标,用以反映一组数据的变异大小(两类指标的联合应用才能全面描述一组数值变量的基本特征)
描述数值变量资料的常用指标指标名称适用的资料均数(X)正态分布或近似正态分布中位数(M)偏态分布、分布未知、两端无界
几何均数(G)对数正态分布、等比资料标准差(s)正态分布或近似正态分布四分位数间距偏态分布、分布未知、两端无界极差(R
)观察例数相近的数值变量变异系数(CV)比较几组资料间的变异大小均数与标准差联合使用描述正态分布或近似正态分布资料的基本特
征中位数与四分位数间距联合使用描述偏态分布或未知分布资料的基本特征最为常见的错误是不考虑这些指标的适用范围和条件的滥用(二)
分类变量资料的描述以比代率,即误将构成比(proportion)当作率(rate)来描述某病发生的强度和频率把各种不同的率相混
淆,如把患病率与发病率、死亡率与病死率等概念混同描述分类变量资料的常用指标指标名称计算公式意义率发生某现象的观察单位数
可能发生某现象的观察单位数描述事件发生的强度和频率构成比A×100%A+B+….事物内部各组成部分所占的比重发病率
Incidence一年内发生的某病新病例数/同年平均人口数在一定时间(一般为1年)内,某人群中发生某种疾病的新病例频率。患病
率(现患率)Prevalence某特定时间内某人群中发现有某种疾病者的比例。死亡率Mortality死亡率=一年内总死亡数
/同年平均人口数在一定时间(一般为1年)内,某人群中死亡的频率。病死率Casefatalityratio因某病死亡人
数/患该病的总数患某病者中因该病死亡者占的比例。三、数据资料的比较(一)假设检验的基本思想样本数据间的不同有两种原因所
致样本来自同一总体,样本指标间的不同是由于抽样误差所引起样本分别来自不同的总体,其样本指标间的不同是由于来源于不同的总体所致
假设检验是反证法原理的统计应用假设两个样本均数可能来源于同一总体,然后计算出在此假设下的某个统计量的大小,当这个统计量在其分布中
的概率较小时(如p≤0.05)我们就拒绝其假设,而接受其对立假设,认为两样本分别来自不同的总体。(二)假设检验的基本步骤建立检验假设(三个内容)无效假设(nullhypothesis)H0备择假设(alternativehypothesis)H1检验水准(sizeoftest)α计算统计量根据统计量的值来得到概率(p)值;再按概率值的大小得出结论(三)假设检验的注意事项前提研究者需要通过样本的信息去推断总体的结论各样本资料对其总体应具有良好的代表性假设检验的概率大小与结论的关系当p≤α时,概率越小,越有理由拒绝H0假设(无差别的假设),即拒绝H0假设的可信程度就越大注意:当p≤α时,不能说“概率越小,组间的差别就越大”假设检验的结论不能绝对化在作出结论时,要避免使用绝对的或肯定的语句当p≤α时,只要p≠0,我们无法完全拒绝无差别的假设,即不能肯定各总体间有差别当p>α时,只要p≠1,我们无法完全接受无差别的假设,即不能肯定各总体间无差别两组与多组比较两组比较:t检验、u检验、两组秩和检验、四格表和较正四格表的X2检验等多组比较:方差分析、多组秩和检验、行乘列X2检验等(也可用于两组比较)注意:错误使用两组比较的方法代替多组比较的情况并不少见,如,三个均数比较用三个t检验、四个t检验
献花(0)
+1
(本文系lfl008首藏)