配色: 字号:
05-假设检验基础(2015研)
2016-05-25 | 阅:  转:  |  分享 
  
Β的大小一般很难确切的估计,只有和特定的H1结合起来才有意义,Β的大小一般很难确切的估计,只有和特定的H1结合起来才有意义,检验统计量是利用样本数据计算得到的一个值,是把样本的信息以统计量的形式表现出来;因为一个样本的信息有很多,实际上统计量是信息的一个综合指标;它可以反应该样本可能存在抽样误差的大小,是用来决定是否可以拒绝H0的证据。检验统计量:属于样本指标,用来反应样本信息,用于计算“H0成立”的概率P,从而抉择是否要拒绝H0。如果样本统计量对应的P值≤α,说明你这个样本属于已知总体,或者说H0的存在是个小概率事件,你对你的H0就要怀疑,怀疑它你就拒绝它。如果你算出的P值>α,说明这种样本还是在你的总体当听,拿到这样一个样本是附合常理的,你没有理由去拒绝它。而且现在有了统计软件,我们可以很容易的得到一个很精确的P值,所以你只要知道这种原理,去下一个拒绝或不拒绝的结论就可以了。1.单凭一个样本不可能去证明哪一个假设正确,哪一个正确的;只能从样本提供的信息去推断哪一个假设成立的可能性较大。2.H0比较明确且单一,H1却包含种种情形,故人们着重考虑H0成立的概率。1.单凭一个样本不可能去证明哪一个假设正确,哪一个正确的;只能从样本提供的信息去推断哪一个假设成立的可能性较大。2.H0比较明确且单一,H1却包含种种情形,故人们着重考虑H0成立的概率。两者个考察样本量不一样SAS中规定:当样本含量n≤2000时,结果以Shapiro–Wilk(W检验)为准,当样本含量n>2000SPSS中则这样规定:(1)如果指定的是非整数权重,则在加权样本大小位于3和50之间时,,计算Shapiro-Wilk统计量。对于无权重或整数权重,在加权样本大小位于3和5000RejectionregiondoesNOTincludecriticalvalue.假设检验所建立的假设主要是控制犯I类错误的概率。Β的大小一般很难确切的估计,只有和特定的H1结合起来才有意义,两类错误的的概率是个未知的,Β的大小一般很难确切的估计,只有和特定的H1结合起来才有意义,假设检验中的两类错误:两类错误的意义真实情况根据样本,作假设检验下的结论不拒绝H0拒绝H0H0为真推断正确I类错误犯错误的概率是a,即检验水准H0为假II类错误犯错误的概率是b推断正确正确的概率是1-b,即检验功效1.第一类错误(弃真错误)拒绝了实际上存在的H0第一类错误的概率为??2.第二类错误(纳伪错误)不拒绝实际上不存在的H0第二类错误的概率为?定义:通常把1-β,即拒绝不正确H0的概率称为检验功效,也称把握度。意义是:当两个总体确有差别时,按所规定的检验水准α的水平,能发现这种差异的能力。如1-β=0.80,理论上100次抽样检验中,平均有80次能够得出差别有统计学意义的结论。一般情况下要求1-β在0.80以上。5.4.3检验功效(poweroftest)由于所建立的检验主要是控制犯I类错误α的概率,而对犯II类错误的概率β却无法直接控制,即对一个检验犯II类错误的概率究竟怎样无所而知。要谨慎对待“不拒绝H0”的结论—即“阴性结果”因此,Power值的大小已成为某些国际会议审查论文设计内容之一;有的已明确规定,若研究者根据P>0.05下阴性结论时,必须提供Power值。检验水准α定的越大总体参数间的差异越大个体差异(标准差)越小样本含量越大5.4.4影响检验功效的因素:检验功效越大1.?越大,?越小,则Power越大??只有通过增加样本含量,你才可能同时减少两类错误!样本含量一定时,?和?的关系就像翘翘板,?小?就大,?大?就小。当样本量取定时,要减小b,应把a取大一些am0H1:m>m0β病人1-βm12.总体参数间的差异越大,Power越大am0β1-βm13.个体差异越小,Power越大am0βm11-β若两样本总体确有差异时,在一定范围内,样本含量n越大,Power越大。通过增大n的方法,达到增大Power的目的检验功效/样本含量估算常用软件:SASnQueryAdvisorEGRETSIZSamplepowerSASAPASSEXCELPASS(poweranalysisandsamplesize)是Jerry开发的专业样本含量估算和效能分析软件。PASS可以对均数间的比较、方差分析、相关和回归分析、计数资料的假设检验和病例随访资料分析等检验条件下的检验效能和样本含量进行估计。小结假设检验是依据样本提供的有限信息对总体做推断的过程。假设检验的步骤为:建立假设→计算统计量→确定p值,作出推断结论假设检验的基本思想是根据小概率的原理,认为“小概率事件在一次抽样中不太可能出现”。假设检验中无论拒绝不拒绝H0,都有可能犯错误(Ⅰ类错误和Ⅱ类错误)。假设检验的推断结果下结论时不能绝对化,并要结合专业知识。步骤:建立假设,确定检验水准确定P值计算检验统计量作推断结论拒绝H0,接受H1,认为差异有统计学意义P≤αP>α不拒绝H0,认为差异无统计学意义案例分析:见教材P89案例1、案例2见每章后:常见疑问案例辨析1:为了比较一种新药与常规药治疗高血压的疗效,以血压下降值为疗效指标,有人作了单组设计定量资料均数比较的检验,随机抽取25名患者服用了新药,以常规药的疗效均值为,进行检验,无效假设是,对立假设是,检验水平α=1%。结果值很大,拒绝了无效假设。“拒绝了无效假设”意味着什么?下面的说法你认为对吗?说法:(1)你绝对否定了总体均数相等的无效假设。(2)你得到了无效假设为真的概率是1%。(3)你绝对证明了总体均数不等的备择假设。(4)你能够推论备择假设为真的概率是99%。(5)如果你决定拒绝无效假设,你知道你将犯错误的概率是1%。(6)你得到了一个可靠的发现,假定重复这个实验许多次,你将有99%的机会得到具有统计学意义的结果。?最佳选择题:1.统计推断的内容是:A.用样本指标推断总体指标B.检验统计上的“假设”C.A、B均不是D.A、B均是2.两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小:A.a=0.05B.a=0.01C.a=0.10D.a=0.203.关于假设检验,下列那一项说法是正确的:A.单侧检验优于双侧检验B.采用配对t检验还是两独立样本t检验是由实验设计方法决定的C.检验结果若P值大于0.05,则接受H0犯错误的可能性很小D.用t检验进行两样本总体均数比较时,不要求方差齐性简答题:1.什么是一类错误?什么是二类错误?二者之间有什么关系?2.P与α有什么区别和联系?3.既然假设检验的结论有可能有错,为什么还要进行假设检验?答案:P值的大小和α没有必然关系。3.P是指H0成立的前提下,出现目前样本数据对应的统计量数值乃至比它更极端数值的概率。α是事先确定的检验水准。4.假设检验中,无论拒绝不拒绝H0,都可能会犯错误:表现为拒绝H0时,会犯第一类错误,不拒绝H0时,会犯第二类错误,但这并不能否认假设检验的作用。.因为只要涉及到抽样,就会有抽样误差的存在,因此就需要进行假设检验。.只是要注意假设检验的结论只是个概率性的结论,它的理论基础是“小概率事件不太可能原理”。.练习题:提问:THANKYOU!特别注意:普查的数据和特征对总体来说是直接的,不作统计推断!只有对抽样研究获取的资料,才需要作参数估计或假设检验!两问题:1.样本73.7次/分,后面有一个μ,这个μ和μ0的关系?2.研究者关心的是两个总体是否相等?可能有两种位置关系→双侧检验不管你谁采的样本、谁作的实验,得出的结果拒绝不拒绝H0,都要以预先设定的α为标准。习惯上我们取值0.05或0.01.建立假设,确定检验水准及单双侧确定P值计算检验统计量作推断结论拒绝H0,接受H1,认为差异有统计学意义P≤αP>α不拒绝H0,认为差异无统计学意义假设检验的步骤:建立假设H0、H1确定检验水准α根据专业知识,确定单、双侧检验5.2.1建立假设检验,确定检验水准:?什么是零假设(NullHypothesis)?(1)一般是作没有差别的假设,又称“原假设”或“无效假设”,表示为H0,即H0:?=某一数值,如?=?0(2)该假设将差异的原因归结为抽样误差1.建立假设:提出无效假设和备择假设?什么是备择假设(AlternativeHypothesis)?(1)与无效假设相对立有差别的假设,由不等号?,??或?组成,常表示为H1;即H1:??某一数值;或?<某一数值,??某一数值。(2)该假设将差异的原因归结为环境因素,或是一种本质差异。2.确定检验水准?由研究者事先确定。表示为?,常用的?值有0.01、0.05;是一个概率值,假设原假设为真时,拒绝原假设的概率,又被称为抽样分布的拒绝域。注意:3.根据数据特征和专业知识,确定单、双侧t临界值-t临界值问:经常参加锻炼的男生与一般男生心率有何不同?①②双侧检验:用于推断两总体有无差别时,对两总体间可能存在的两种位置关系均要考虑在内。拒绝域拒绝域a/2a/2接受域1-?t临界值问:经常参加锻炼的男生是否低于一般男生的?拒绝域接受域1-?2.单侧检验:用于推断两总体有无差别时,仅考虑两总体间可能存在的两种位置关系的一种。①a一般情况下,如结果不明确时,采用双侧假设H1:??某一数值,如???0(双侧,包括???0和?=50正态偏态两独立样本假设检验单样本配对资料差值正态偏态对子数t检验n>=50例数正态偏态n<50t检验方差不齐方差齐变量变换或秩和检验t’检验【例5-1】某一般中学男生的心率平均值μ0=75次/分,标准差σ=5.0次/分(大规模调查获得);我们通过抽样调查,获得经常参加体育锻炼的某中学100名男生的心率平均值为;问:经常参加体育锻炼的男生心率是否与一般中学男生的不同?【案例解析】研究目的:差异性比较资料类型:定量资料设计类型:单样本设计单样本资料Z检验总体标准差已知,σ=5.0H0:μ=μ0H1:μ≠μ0α=0.05统计结论:已知Z(0.05/2)=1.96,则P<0.05,故拒绝H0,接受H1,认为μ与μ0的差别有统计学意义,可认为经常参加锻炼的中学男生人群的心率低于一般人群的心率。专业结论:经常参加体育锻炼有助于增强男生的心功能。检验过程:1.建立假设:确定检验水平:2.计算检验统计量:3.确定p值,作出推断结论:某药物100mg溶解在1L溶剂中,溶解后的标准浓度是20.00mg/L。现采用某种测定方法进行溶解实验,重复实验11次获得的药物浓度分别为:20.99、20.41、20.10、…、21.11。请问:用该种方法测得的药物浓度与标准浓度20.0mg/l是否相同?【案例5.2】【案例解析】研究目的:差异性比较资料类型:定量资料设计类型:单样本设计正态性检验单样本资料t检验该样本来自正态分布的总体n=11,样本含量较小H0:μ=20mg/L,仪器正常H1:μ≠20mg/L,仪器不正常α=0.05检验过程:1.建立假设:确定检验水平:2.计算检验统计量:3.确定p值,作出推断结论:统计结论:查t界值表,得t(0.05/2,10)=2.228,按α=0.05检验水准,拒绝H0,接受H1;认为这种方法测得的药物浓度与标准浓度不同。专业结论:该方法测得的药物总体平均浓度高于标准,该方法的效果欠佳。【电脑实现】—SPSS1.正态性检验:正态性检验结果输出:H0:呈正态分布;H1:不呈正态分布α=0.10有建议:当n≤2000时,结果以Shapiro-Wilk(W检验)为准;当n>2000时,结果以Kolmogorov-Smirnov(D检验)为准2.单组样本均数t检验:结果输出:两总体均数差及95%CI用于比较的已知总体均数置信区间回答了“量”的问题:即总体均数差在哪个位置,差异大小是多少;如本题0.98(0.27,1.70)mg/L。而假设检验回答了质的问题:即如果两总体均数间存在着差异,那么比统计学的角度确认这种差异的把握度有多大,如本题P=0.012。注意:总体均数差的置信区间和t检验结果是完全一致性的,同时这两者又互为补充:【结果报告】用某仪器测量浓度为20mg/L的标准液11次,得样本均数和标准差分别为20.98mg/L、1.068mg/L。经单样本设计资料t检验,t=3.056,v=10,P=0.012,两总体的均数差及95%CI为0.98(0.27,1.70)mg/L;按α=0.05的检验水准,拒绝H0,接受H1,认为差异有统计学意义(统计结论);该仪器测得的浓度总体上高于标准液,认为该仪器存在着系统误差(专业结论)。5.4假设检验的两类错误和检验功效假设检验是统计推的重要内容,它是应用数学上的反证法和小概率事件实际推断原则,根据样本统计量对总体作出推断,结论具有概率性。结论的风险性—两类错误I类错误(typeIerror)——弃真:I类错误示意图(以单侧t检验为例)ta临界值H0:m=m0正常人1-?am0误诊(假阳性)实事:H0为真II型错误示意图(以单侧t检验为例)ta临界值H0:m=m0正常人1-?am0H1:m>m0β病人1-βm1漏诊(假阴性)II类错误(typeIIerror))——存伪:实事:H0为假,H1为真检验功效5假设检验引子:1.医学科学研究的特点→医学统计学的任务普查:直接得到关于总体的认知,不需要统计推断。抽样调查抽样误差参数估计假设检验风险假设检验的基础假设检验的基本思想假设检验的步骤单组样本资料的假设检验假设检验的两类错误假设检验的几个观点【例5-1】某一般中学男生的心率平均值μ0=75次/分,标准差σ=5.0次/分(大规模调查获得);我们通过抽样调查,获得经常参加体育锻炼的某中学100名男生的心率平均值为;问:经常参加体育锻炼的男生心率是否与一般中学男生的不同?未知总体第二种可能性:已知总体样本均数与拟比较的总体均数不等有两种可能:抽样误差本质差异-运动的影响n=100第一种可能性:唯证据原则—反证法没有差异假设检验作检验无罪假设刑事诉讼找证据假设检验实质是反证法与概率学小概率理论的一个完美结合什么是假设检验?假设:先预设一种立场,是对总体参数的数值所作的一种陈述例:认为经常参加体育锻炼的男生心率与一般中学男生的没有差异,即μ1=μ;其实质是将样本统计量与已知总体均数μ之间差异的原因归结为抽样误差。检验:是一种方法,它一定是利用样本提供的信息,从概率的角度来判断这个假设是正确的(是抽样误造成的)?还是错误的(不是抽样误差造成的)?下结论H0:零假设t界值t分布图,ν=25a/2a/2-t界值根据P值,得出结论H1:备择假设验证假设建立假设下结论检验统计量预设α=0.05P值三个重要概念:检验水准α检验统计量概率P值1.小概率事件原则和检验水准α小概率事件检验水准-α(leveloftest)是一个概率值;在假设检验中,定义发生概率≤α的事件叫小概率事件,将α称为检验水准;应事先确定α,一般取值0.05或0.01。选α为0.05只是一种习惯,而不是绝对的标准。概率2.检验统计量:检验统计量是利用样本数据的多种信息,计算得到的一个综合指标;它可以反应该样本可能存在抽样误差的大小,从而成为决定是否可以拒绝H0的证据。在零假设情况下,统计量服从一个给定的概率分布(如t分布、F分布和分布等)。如果算出的检验统计量取值落在该分布的临界值之外,则可认为该零假设的成立是个小概率事件,可下拒绝H0的决定。而且,该检验统计量的绝对值越大,拒绝H0的理由越充分,反之不拒绝H0的理由越充分。3.概率P值:就是根据抽样分布的规律,由H0所规定的总体中作一次随机抽样,实际中得到目前这个样本,甚至包括比这个更偏、更极端样本的累积可能性。换言之:在H0成立的前提下,出现目前检验统计量及更不利于H0成立的统计量的累积概率,也就是H0成立的概率。假设检验的P值P≤αP≤α-t界值t界值P>α关于假设检验的几个观点根据P值下结论:当P≤α时,则结论为:按检验水准拒绝H0,接受H1,认为差异有统计学意义(统计结论),可认为…不同或取值高于##的(专业结论);当P>α时,则结论为:按检验水准不拒绝H0,认为差异无统计学意义(统计结论),还不能认为…不同或取值高于##(专业结论)。“不拒绝H0”只因为此时拒绝H0的证据不足,绝不等同于接受H0。所以下结论时对H0只能说“拒绝”或“不拒绝”,而对H1只能说“接受”。假设检验的结果只能说明有无统计学意义(statisticalsignificance),而不能说明专业上的差异大小:P值越小只能说明,作出拒绝H0,接受H1的统计学证据越充份,推论时犯错误的机会越小;而与专业上∣μ1-μ2∣的大小无直接关系。当P值接近于α值时,下结论应尤其慎重。5.2假设检验的步骤特别注意:普查的数据和特征对总体来说是直接的,不作统计推断!只有对抽样研究获取的资料,才需要作参数估计或假设检验!两问题:1.样本73.7次/分,后面有一个μ,这个μ和μ0的关系?2.研究者关心的是两个总体是否相等?可能有两种位置关系→双侧检验不管你谁采的样本、谁作的实验,得出的结果拒绝不拒绝H0,都要以预先设定的α为标准。习惯上我们取值0.05或0.01.检验统计量是利用样本数据计算得到的一个值,是把样本的信息以统计量的形式表现出来;因为一个样本的信息有很多,实际上统计量是信息的一个综合指标;它可以反应该样本可能存在抽样误差的大小,是用来决定是否可以拒绝H0的证据。检验统计量:属于样本指标,用来反应样本信息,用于计算“H0成立”的概率P,从而抉择是否要拒绝H0。如果样本统计量对应的P值≤α,说明你这个样本属于已知总体,或者说H0的存在是个小概率事件,你对你的H0就要怀疑,怀疑它你就拒绝它。如果你算出的P值>α,说明这种样本还是在你的总体当听,拿到这样一个样本是附合常理的,你没有理由去拒绝它。而且现在有了统计软件,我们可以很容易的得到一个很精确的P值,所以你只要知道这种原理,去下一个拒绝或不拒绝的结论就可以了。1.单凭一个样本不可能去证明哪一个假设正确,哪一个正确的;只能从样本提供的信息去推断哪一个假设成立的可能性较大。2.H0比较明确且单一,H1却包含种种情形,故人们着重考虑H0成立的概率。1.单凭一个样本不可能去证明哪一个假设正确,哪一个正确的;只能从样本提供的信息去推断哪一个假设成立的可能性较大。2.H0比较明确且单一,H1却包含种种情形,故人们着重考虑H0成立的概率。两者个考察样本量不一样SAS中规定:当样本含量n≤2000时,结果以Shapiro–Wilk(W检验)为准,当样本含量n>2000SPSS中则这样规定:(1)如果指定的是非整数权重,则在加权样本大小位于3和50之间时,,计算Shapiro-Wilk统计量。对于无权重或整数权重,在加权样本大小位于3和5000RejectionregiondoesNOTincludecriticalvalue.假设检验所建立的假设主要是控制犯I类错误的概率。Β的大小一般很难确切的估计,只有和特定的H1结合起来才有意义,两类错误的的概率是个未知的,Β的大小一般很难确切的估计,只有和特定的H1结合起来才有意义,Β的大小一般很难确切的估计,只有和特定的H1结合起来才有意义,Β的大小一般很难确切的估计,只有和特定的H1结合起来才有意义,【案例】药物 1 2 3 4 5 6 7 8 9 10 A 服药前 75.6 61.2 67.8 77.2 73.2 65.4 80.0 74.4 82.6 68.6 服药后 73.0 60.2 63.6 72.0 74.6 60.8 69.4 77.4 79.6 63.4 B 服药前 69.4 89.9 66.8 63.4 70.0 86.6 90.4 74.8 67.4 84.4 服药后 60.8 95.5 61.6 62.0 69.4 78.0 71.0 76.6 58.2 75.4

假设数据服从正态分布,且总体方差齐,在评价A、B两种药物对肥胖患者是否有效时,作者对A、B两组患者分别采用了独立样本的t检验,结果:A组患者服药前后比较t=1.040,P=0.312;B组患者服药前后比较t=1.125,P=0.275,从而得出结论,两种药物均无效。

有人认为这种方法不太好,他采用独立样本的t检验,首先比较服药前两组基线水平,结果t=1.533,P=0.160,表明差异没有统计学意义,两组有可比性。进而,比较治疗后两组体重的差异,结果t=0.346,P=0.734,从而得出结论:A、B两种药物的疗效差异无统计学意义。

请对以上两种做法发表你的看法。

献花(0)
+1
(本文系浮云小豆豆首藏)