分享

统计学重点简述和习题

 hchungw 2020-01-12

统计学重点简述和习题

第一章 绪论

统计学(statistics),是研究数据的收集、整理、分析的一门科学,帮助人们分析占有信息。达到去伪存真、去粗存精、争取认识世界的一种重要手段。

卫生统计学(health statistics):是研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。

统计描述(descriptive statistics)用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行滴定和描述。

统计推断(statistical inference):通过样本指标来说明总体特征,从样本获取有关总体信息的过程

总体(population):是根据研究目的确定的同质观察单位的全体。

样本(sample)从总体中随机抽取部分由代表性的观察单位,其测量值的集合称为样本。

变量(variable):在确定总体之后,研究者则应对每个观察单位的某项特征进行测量和观察,这种特征称为变量。

变异(variation):指在自然地状态下,个体测量结果在同质基础上的差异。

随机抽样(random sample):按随机化原则从总体中抽取部分观察单位的过程。以避免误差和偏倚对研究结果有所影响。

样本含量或样本大小(sample size):样本包含的观察单位数称为样本含量,医学上也称为样本例数。

定量资料(quantitative data)是测量每个观察单位某项指标大小所得到的资料,一般均有度量衡单位。

分类资料(categorical data):观察值是定性的,表现为互不相容的类别或属性。

有序分类(ordinal categories):各类之间有程度的差别,给人以“半定量”的概念。

概率(probability):是度量某一随机事件A发生可能性大小的一个数值,记为PA),PA)越大,说明A事件发生的可能性越大,0<P(A)<1,小概率事件。

统计工作的步骤:设计(design),收集资料(collection),整理资料(sorting data),分析资料(analysis of data)(统计描述descriptive statistics)、统计推断(inferential statistics

第二章 定量资料的统计描述

对称分布:是指集中位置在中间,左右两侧频数大体对称。

偏态分布:指集中位置偏向一侧,频数分布不对称,分为正偏态和负偏态。

均数(mean):描述一组数据在数量上的平均水平,适用于对称分布,特别是正态或者近似正态分布的定量资料。

中位数(median),是指将一组观察值从小到大排列后,居于中间位置的那个数值。将一组观察值由小到大排列,n为奇数时取位次居中的变量值,为偶数时,取位次居中的两个变量的平均值。

极差(range):是全部数据中最大值与最小值之差,它描述了数据变异的程度。又称全距,为最大值与最小值之差,用于资料的粗略分析,计算简便但稳定性较差。符号R.

标准差:反映定量资料离散趋势的指标,它能反映每一个变量值与均值的平均的离散程度,S越小,变量值与均值离散程度越小,均数代表性越好。

变异系数(coefficient of variation CV):标准差与算术均数的比值。

频数分布表的用途:

1揭示资料的分布类型

2由频数分布表可以看到频数分布的两个重要特征:集中趋势和离散趋势。

3便于发现某些特大或特小的可疑值。

4便于进一步计算统计指标和做统计处理。

描述集中趋势的指标:均数X,几何均数G,中位数M

描述离散趋势的指标:极差,方差,标准差,四分位数间距IQR,变异系数CV

第三章 正态分布

正态分布: X的频数曲线对应于数学上的正态分布曲线(曲线呈钟型,两头低中间高,左右对称)则称该指标服从正态分布。

正态分布的应用:归频数分布:制定参考值范围,作质量控制,统计处理方法的基础。

第四章 总体均数的估计和假设检验

抽样误差(sampling error):是由个体变异产生的,抽样造成的样本统计量与总体参数的差异。

标准误(standard error)是样本统计量的标准差。

均数的标准误(standard error of mean SEM)用于表示均数抽样误差的指标,反映样本均数之间的离散程度和样本均数抽样误差的大小。

参数估计:是指用样本指标值(统计量)估计总体指标值(参数)。

点估计:就是用样本统计量直接作为总体参数的估计值。

区间估计confidence interval CI:按预先给定的概率(1-a)确定的包含未知总体参数的可能范围。该范围通常称为参数的可信区间或置信区间。

I类错误:拒绝了实际上成立的H0这类弃真的错误称为I类错误,概率大小用α表示。

II类错误:接受了实际上不成立的H0这类存伪的错误称为II类错误,概率大小用β表示。

可信度:预先给定的1-a。为按预先给定的概率确定的包含未知总体参数的可能范围,含义是包含总体参数的可能性是1-a

检验效能(power of a test)(1-β)当两总体确有差异,按规定检验水准,所能发现该差异的能力。

中心极限定理:

1从正态总体Nμ,σ)中,随机抽取例数为n的样本,样本均数也服从正态分布,即使从偏态总体中随机抽取,当n是足够大时(如n>50),也近似正态分布。

2从均数µ,标准差σ的正态或偏态总体,抽取例数为n的样本,样本均数的总体均数也为µ,标准差用σ=

统计推断包括:参数估计和假设检验。

标准误的用途:可反映样品均数与总体均数距离远近,反映可靠性:与样本均数结合估计总体均数的可信区间;进行假设检验。

假设检验应注意的问题:1,要有严密的研究设计2,不同变量或资料应选择不同的检验方法3,正确理解“显著性”一词的含义4,做结论不能绝对化5,统计“显著性”与医学临床/生物学“显著性”。

可信区间与假设检验:1可信区间亦可回答假设检验的问题,2可信区间比假设检验可提供更多的信息。

第五章 方差分析

变量变换:将原始数据做某种函数转换,使各组达到方差齐性,也可使资料转换为正态分布。

方差分析的基本思想:就是把全部观察值间的变异(总变异)按设计和需要分解成两个或多个组成部分,总自由度也分解成相应的几个部分,再做分析。

分解的每一部分代表不同的含义,其中至少有一部分代表各均数间的变异情况,另一部分代表误差。离均差平方和除以自由度得均方,组间均方与误差均方之比为F值,F值远大于1,表示各组均数间差别有显著性,F值远小于1,表示各组均数间差别无显著性,可查F界表确定P

方差分析的用途:两个或多个样本均数的比较,分析两个或多个研究因素的交互关系以及回归方程的线性假设检验。

方差分析的应用条件:1,各样本是相互独立的随机样本,2各样本来自正态总体,3各处理组总体方差齐性。

变量变换:1目的:使方差性齐;资料正态化;还可用于曲线直线化;2类型:对数变换:平方根变换;倒数变换;平方根反正弦 变换等。

第六章  分类资料的统计描述

Relative number相对数:由两个有联系的指标之比组成的用以描述分类变量的统计指标。

Rate率:又称频率指标,说明某现象发生的频率或强度。率=发生某现象的观察单位数/可能发生某现象的观察单位总数×100%

Proportion构成比:又称构成指标,说明某一事物内部组成部分所占的比重或分布。构成比=某一组成部分的观察单位数/同一事物各组成部分的观察单位总数×100%

Ratio比:又称相对比。是AB两个有关指标之比,说明AB的若干倍或百分之几。比=A/B

Standard mortality ratio SMR标准化死亡比:指被标化组实际死亡数与预期死亡数之比。若SMR>1,表示被标化人群的死亡率高于标准组:反之若SMR<1,表示被标化人群的死亡率低于标准组。

Dynamic series动态数列:是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。

定基比:即统一用某个时间的指标作基数,以各时间的指标与之相比,是常用的动态数列分析指标之一。

环比:以前一个时间的指标作基数,以相邻的后一个时间的指标与之相比。是常用的动态数列分析指标之一。

应用相对数应注意的问题:计算相对数的分母一般不宜过小,当例数小于30时,宜用绝对数表示为好;分析时不能以构成比代替率,应当注意不能用构成比的动态分析代替率的动态分析;对观察单位不等的几个率,不能直接相加求其总率,在比较相对数时应注意可比性;对样本率(构成比)的比较应随机抽样,并做假设检验。

标准化法的基本思想:当两组或多组率之间比较,其内部各小组的率明显不同,且各小组的观察例数的构成比也明显不同时,则不能直接比较两组或多组的总率,得出结论。为消除构成不同造成的影响。采取统一的标准构成进行调整,使之标准化,以具有可比性。

标准化率的计算(直接法):p’=p’=

Ni:标准组个小组例数:pi:被标化组各小组的率,N:标准组总例数

平均发展速度=  a0=基期指标;an:第n年指标

平均增长速度=平均发展速度-1

第九章    秩和检验

参数统计:通常要求样本来自总体分布型是已知的,在这种假设的基础上,对总体参数进行估计和检验。

非参数统计:当样本来自总体分布型是未知的或总体分布与检验所要求的条件不符时,所使用的统计方法。不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验。

非参数统计的优缺点:1应用范围广,简便,易掌握,对资料分布特征无特殊要求。

                    2当资料适合参数统计,而用非参数统计会损失部分信息,减低检验效能。

秩和检验方法

配对设计差值的符号

秩和检验

成组设计两样本比较的秩和检验

成组设计多样本比较的秩和检验

假设

H0M=0

H1M≠0

α =0.05

H0两总体分布相同

H1两总体分布不同

α =0.05

H0总体分布均相同

H1总体分布不同或不完全相同

α =0.05

方法

1,差值由小到大编秩,人去T+T-,查表确定p值。

2,N>25,用μ检验

1.所有数据由小到大编秩,小ni组秩和为T。查表确定p值。

2. n1>10n2-n1>10时,用μ检验

1.所有数据由小到大编秩,求出各组秩和Ri计算H值。

2.k=3,n5时查H界值表确定p,当最小n>5时,v=k-1.

查X2表,确定p。

注意事项

编秩时,绝对值相等者,取平均秩次

1.编秩时,相同数据在不同组内取平均秩次

2.相同秩次较多时,需要校正。

1,编秩时,相同数据在不同组内取平均秩次。

2.相同秩次较多时,需校正。

第十一章 回归和相关

直线相关:或简单相关,描述两变量的相互关系,用于双变量正态分布资料。有正相关、负相关和零相关(非直线相关)系。

相关系数:或累积相关系数,说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。样本相关系数用r表示,总体相关系数用ρ表示。

直线回归:描述两变量间的依存关系。利用回归分析方法能够找到一个描述变量之间的变化关系的数学表达式。

回归系数:或直线的斜率,样本回归系数b,总体回归系数βb的统计学意义为:X每增加/减少一个单位时,Y平均改变b个单位。

剩余:或残差,即实际值与估计值之差。SSB2,为Y的离均差平方和。说明未考虑XY的回归关系时Y的变异。

剩余平方和:SS,即2,它反映XY的线性影响之外的一切因素对Y的变异情况。也就是在总平方和中无法用X解释的部分,其值越小,说明直线回归的估计误差越小。

回归平方和:SS,即2 它反映由于XY的直线关系而使Y的总变异减小的部分。也就是在总平方和中可以用X解释的部分,其值越大,说明回归效果越好。

剩余标准差:指当XY的影响被扣除后,Y仍存在变异,此变异由抽样误差造成,与X无关。用来反映Y的剩余变异。

预测:吧预报因子(X)代入回归方程对预报量(Y)进行估计,其波动范围可按求个体Y值容许区间方法计量。

统计控制:利用回归方程进行逆估计,要求Y在一定范围内波动,可以通过控制X的取值来实现。

决定系数:即r2=SS/SS.当总平方和固定不变时,回归平方和的大小取决于r2

秩相关:又称等级相关,用双变量等级数据作直线相关分析,适用于1,不服从双变量正态分布而不宜作积差相关分析,2,总体分布型未知,3,用等级表示原始数据。

等级相关系数:即rs,说明两个变量间相互关系的密切程度与相关方向,用于下列资料:1,不服从双变量正态分布而不宜作积差相关分析,2,总体分布型未知,3,用等级表示原始数据。

假设检验:1b,方差分析,t检验;2界值表,t检验。

直线回归方程的应用:1描述两变量的依存关系;2预测;3统计控制

应用直线回归应注意的问题:

1.       作回归要有实际意义。

2.       回归分析前绘制散点图,观察直线趋势,修正或删除异常点。

3.       直线回归方程的适用范围一般以自变量的取值范围为限。

相关和回归的区别:

1.       资料要求不同:回归要求Y服从正态分布,X可精确测量和严格控制:相关要求双变量正态分布。

2.       应用情况不同:回归——依存关系:相关——相互关系。

相关和回归的联系:

1.方向一致:rb符号一致。

2.假设检验等价:统一样本,rb的假设检验得到的t值相同。

3.用回归解释相关。

A. SS越接近SS,,则r2越接近l,说明引入相关的效果越好。

B. 相关系数的大小与SS及回归系数有关,所以相关系数不能作为回归估计精度的指标。

秩相关的应用条件:

1.      不服从双变量正态分布而不宜作积差相关分析。

2.      总体分布型未知。

3.      用等级表示的原始数据。

第十二章 常用统计表

统计表:在科技报告或论文中,常将统计资料及指标以表格列出,称为统计表。可分为简单表和复合表。

统计图:是用点的位置、线段的升降、直线的长短或面积的大小等形式表达统计资料,可直观反映出事物间的数量关系。

列表原则:1重点突出,简单明了2主次分明,层次清楚,符合逻辑。

列表基本要求:1标题2标目3线条4数字5不列备注

制图基本要求:1标题2标目3图例

常用统计图

统计图

定义

制图

直条图

用等宽长条的高度表示按质量分组的资料

起点为0,等宽,等间距直条,按高低顺序排列。

圆图

以圆面积表示事物的全部,用扇形面积表示各组成部分所占比重

圆面积为100%,各构成比分别乘3.6度,绘扇形面积,以12点为始,由大到小依次绘制。

普通线图

用线段的升降表示随时间变化的趋势,用于连续性资料

XY轴为算术尺度,相邻两点以折线连接

半对数线图

用线段的升降表示随时间变化的变动速度,用于连续性资料

X轴为算术尺度,Y轴为对数尺度。

直方图

用矩形面积表示连续性变量的频数分布。

X轴表示连续性变量的组段,Y轴表示频数或频率,尺度从0开始

散点图

以点的密集程度和趋势表示两种事物间的相关关系。

同线图,但相邻两点间不连接。

第十三章  实验设计

实验研究:是指研究者根据研究目的主动加以干预措施,并观察总结结果,回答假设研究所提出的问题的一种研究方法。依研究目的分为实验研究和临床试验。

实验研究设计(experimental design):是以动物或标本(如血,痰,尿等)为研究对象采取干预措施的研究。

临床试验(clinical trial):从统计学角度出发,只要是以人为研究对象并采取了干预措施的研究统称为临床试验,可分为临床疗效实验和社区干预实验。

随机化原则:即总体中的每个观察单位都有相等的机会被选入到样本中来。

随机分配(randomized allocation):为增强可比性,依型讲究假设的要求规定了纳入标准,将实验对象分入实验组和对照组中。

空白对照:对照组不施加任何处理措施。

安慰剂对照:在实验研究中,对照组使用一种外形与实验药物完全相同而毫无药理作用的物质,这种对照称为安慰剂对照。

实验对照:对照组和实验组的处理措施区别在于:实验组加入了有效成分,而对照组则无。

标准对照:用公认的有效药物、现有的标准方法或常规方法做对照。

自身对照:对照和实验措施在同一实验对象上实施。

相互对照:几个处理(或水平)互为对照。

处理因素:是根据研究目的而施加的特定的实验措施。

实验效应:主要只处理因素作用于实验对象的反应,这种效应将通过实验中观察指标显示出来。观察指标应该客观性较强,灵敏度较高。精确性较强。

准确度(accuracy):观察值与真值的接近程度。

精确度(precision):重复观察时:观察值与其平均值的接近程度。

随机对照试验(randomized control trial):将受试对象随机分配到实验组和对照组,通过比较分析回答研究假设的问题。

随机双盲对照实验(randomized double blind control trial):在随机对照试验的基础上再采用双盲法。

配对设计(paired design):将实验对象按一定条件配成对子,如将年龄、体重一致的动物配成对子。再将每对中的两个受试对象随机分配到不同处理组。据以配对的因素为可能影响实验结果的主要混杂因素。

系统误差:由于受试对象,研究者,仪器设备,研究方法等非实验因素影响等确定性原因造成,有一定倾向性或规律性的误差,可以避免。

偏倚:指在实验中由于某些非实验因素的干扰而形成的系统误差,歪曲了处理因素的真实效应。

选择性偏倚selective bias:由于纳入观察对象的方法不正确而产生的偏倚。

测量性偏倚 measurement bias:实验过程中对研究对象进行观察或测量而造成的偏倚。

沾染contamination:对照组实验对象接受实验组的处理措施,提高了对照组的有效率,结果导致了实验组和对照组的差异。

干扰cointervention:实验组从实验外接受了对实验因素有效的药物或措施(非处理措施),提高了实验的有效率,结果扩大了实验组和对照组的差异。

依从性:compliance受试者对于干预措施及实验过程的执行程度。

非依从性noncompliance:受试者为按照研究人员的规定方案执行称为非依从性。

失访lost to followup:受试者在实验过程中由于各种原因退出实验称为失访。

双盲法(double blind method):课题主持人采取措施使研究者和研究对象均不知道接受实验措施或对照措施。

单盲法:single blind method:只有患者不知道处理措施的内容。

三盲法:triple blind method:主持人/研究者/患者均不知道处理措施的内容。

混杂偏倚 confounding bias:在总结分析阶段,由某些非实验因素与实验因素同时并存的作用影响到观察的结果,造成混杂因素的偏倚。

实验设计的基本原则:随机化、对照、重复。

对照原则的目的: 实验研究的目的是验证研究假设是否正确,只有经过比较才能鉴别其真伪,设对照组是比较的基础,没有对照很难说明研究假设是否正确;设立对照也是控制实验过程中非实验因素的影响和偏倚的一种有力措施。常用的对照有:空白对照,安慰剂对照,实验对照,标准对照,自身对照,相互对照。

重复原则:含义为1足够的样本含量;2实验的次数。

实验设计的三要素:处理因素、实验效应、受试对象。

确定受试对象纳入标准应注意:

1应纳入对处理因素的效应反应灵敏的患者。

2某些处理措施对一些特殊人群产生有害作用,应排除实验之外。

常用的实验设计方法:随机对照实验,配对设计,交叉设计,配伍组设计。

随机对照试验有点(随机化的目的)

1有效避免非实验因素的影响,使实验因素充分显示

2增强各比较组间的可比性,使研究结论更可靠。

3更好地控制非实验因素对实验因素的影响,有效地控制了偏倚和误差。

4满足了随机化原则,使检验结果反映 真实差异。

交叉设计的优点:

1节约样本含量

2能控制时间因素及个体差异对处理因素方式的影响

3从医德观点出发,均等考虑每个患者的利益。

交叉设计的注意事项:

1前提是两种处理方式不能相互影响。

2不适用于病程较短急性病效果的研究

3应尽可能采用盲法。

确定样本含量的意义:正确确定样本含量是实验设计的一个重要组成部分,估计样本含量应克服两种倾向:1片面追求增大样品含量导致人力、物力和时间的浪费,还可能引入更多的混杂因素。2样本含量偏少,检验效能偏低,导致总体本来存在的差异未能检出,导致非真实的阴性结果。样本含量大小还受个体差异和研究实验要求的精神有关。阅读专业文献时,对假设检验阴性结果有必要复核样本含量和检验效能是否偏低。以正确分析假设检验的结论。

第X章 2检验

2 test (Chi-square test)2是一种用途较广的假设性检验方法,可用于推断两个及多个总体率或总体构成比之间有无差别,两种属性或两个变量之间有无关联性,以及频数分布的拟合优度检验等。

2检验的基本思想:2值是以理论数为基数的相对误差,它反映了实际数与理论数吻合的程度(差别的程度)。若检验假设成立,则实际数与理论数的差别不会很大,出现大的2值的概率p是很小的,若Pα检验水准,就怀疑假设,因而拒绝它,若Pα,则无理由拒绝它。

理论数的计算:Tic=, Ti,r第i行第c列的理论数,ni为Tic所在的行合计,nc为Tic所在的列合计:n为总例数。

2检验的基本公式:2=   ————————————(1)

2检验的校正公式:2=    ——————————(2)

四表格专用公式

四表格专用公式:2=—————————(3)

校正公式2=———————(4)

四格表2检验的条件:

1当n40且所有的T5时,用普通的2检验(公式1,3),若所得Pα,改用确切的概率法。

2当n40但又1T5,用校正的2检验(公式2,4)。

3当n<40或有T<1时,不能用2检验,改用确切概率法。

配对四格表资料的2检验: 2=,v=1(b+c40时使用)

             校正公式2=,v=1 (b+c<40时使用)

行X列表的2检验公式2=n)无校正公式

行X列表的2检验的注意事项:

1不能有理论数T<1,并且1T5的格子数不超过总格子数的1/5.

2当检验有统计学意义(拒绝H0)时,只能认为各总体率或构成比之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者之间有差别。若要进一步解决此问题,可用2分割法。

3若表格有一个方向按多个等级分类,则称单向有序行列表,当等级数大于3时,一般用秩和检验分析更为适宜。

四格表的确切概率法的应用条件:

1,四格表内理论频数T<1

2,样本含量n<40

3,2检验后所得概率P接近检验水准α

试题:

一、           名词解释:

1,coefficient(相关系数):又称积差相关系数(product-moment correlation),是说明具有直线关系的两个变量间,相互关系的密切程度与相关方向的指标。

2,proportion(构成比):又称构成指标。说明某一事物内部的各组成部分所占的比重或分布,计算公式为:某一组分的观察单位数除以同一事物各组分的观察单位总数*100%,表示方法有百分数等。

3,coefficient of variation (变异系数):常记为CV。它被定义为标准差与算术平均数之比。即CV=S/×100%。它描述了相对于算术均数而言。标准差的大小,即描述数据的变异相对于其平均水平来说是大还是小。

4,population(总体):是根据研究目的确定的同质的观察单位的全体,确切的说是同质的所有的观察单位某种变量值的集合。

5,standard error SE(标准误):样本均数的标准差也称均数的标准误(standard error of mean)它反映了样本均数间的离散程度,也反映了样本均数与总体均数间的差异,说明均数抽样误差的大小。

6,incidence rate(发病率):表示一定时期内,在可能发生某病的一定人群中新发生的某病例数。其计算公式为:某病发病率=该期间新发生的某病例数/一定期间内可能发生某病的平均人口数×100%

7,Chi-square2值)是以理论数为基数的相对误差,它反映了实际数与理论数吻合的程度(差别的程度)。

8,Chi-square test2检验):是一种用途较广的假设检验方法,即推断两个及多个总体构成比之间有无差别,两种属性或两个变量之间有无关联性,以及频数分布的拟合优度检验等。

9,Normal distribution(正态分布):若X的频数曲线应用于数学上的正态分布曲线(曲线呈钟型,两头低中间高,左右对称),则称该指标服从正态分布。

10,           Mortality rate(死亡率):指某地某年平均每千人口中的死亡数,它反映居民总的死亡水平。死亡率=某人群某年(因某病)总死亡人数/该人群同年平均人口×1000

简单题

1: 应用相对数应该注意什么?

计算相对数的分母一般不宜过小;分析是不能以构成比代替率,应当注意不能用构成比的动态分析代替率的动态分析;对观察单位不等的几个率,不能直接相加求其总率,在比较相对数时应注意可比性;对样本率(构成比)的比较应随机抽样,并做假设检验。

2:方差分析的基本思想?

根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个或几个因素的作用加以解释,通过比较不同变异来源地均方,借助F分布做出统计推断,从而了解该因素对观测指标有无影响。F值远大于1,表示各组均数间差别有显著性,F值远小于1,表示各组均数间差别无显著性,可查F界表确定P.

3:相关和回归的区别和联系?

直线回归与相关的区别1资料要求不同:回归要求变量Y服从正态分布,X是可以精确测量和严格控制的变量,相关要求两个变量XY服从双变量正态分布,2应用情况不同:说明两变量间依存变化的数量关系用回归,说明变量间的相关关系用相关3,意义不同:回归系数b表示自变量X每变化一个单位后应变量Y的平均变化量,相关系数r表示两变量相关的方向和密切程度,4取值范围不同:-1<=r<=1b负无穷到正无穷大。5单位不同,回归系数b有单位,相关系数r没单位。

直线回归与相关的联系:1两者都是研究两个数值变量的关系的统计方法,2方向一致:对一组数据若同时计算rb,他们的正负号一致,r为正说明两变量间的相互关系是同向变化的,b为正号说明X增减一个单位,Y平均增减b个单位,3假设检验对同一样本,rb的假设检验得到的t值相等,由于r的假设检验简单,故在实际应用中常用以前法代替后法,4用回归解释相关,决定系数P2=SS/SS总,回归平方和越接近总平方和,R2越接近1

4:X列表2检验注意事项。

答:1.不能有理论数T<1,并且1T5的格子数不超过总格子数的1/52.当检验有统计学意义(拒绝H0)时,只能说明各总体率或构成比之间总的来说有差别,但不能说明它们之间都有差别,成两者之间有差别,若要进一步解决此问题,可用2分割法。3,若表格有一个方向按多个等级分类,则称单向有序行X列表,当等级数大于3时,一般用秩和检验分析更为适宜。

5:可信区间和假设检验的关系?

可信区间用于说明量的大小即推断总体均数的范围,而假设检验用于推断质的不同即判断两总体均数是否不同,两者相互联系又相互区别;可信区间亦可回答假设检验的问题;可信区间比假设检验可提供更多的信息,但并不意味着可信区间能够完全代替假设检验;可信区间只能在预先规定的概率——检验水准的前提下进行计算,而假设检验能够获得较为确切的P值,故两者结合起来次才是完整的分析。

6:二项分布应用条件?

答:1.每次试验结果,只能是两个互斥的结果之一(A或非A)。2.每次试验的条件不变,即每次试验中A发生的概率不变,均为x3.各次实验独立,即一次试验出现什么样的结果与前面已出现的结果无关。

7:.t检验的应用条件,方差不齐时的处理方法?

答:当样本含量较小时,理论上要求样本取自正态总体,两样本均数比较时还要求两样本方差相等,(u检验应用条件:样本含量较大,或n虽小但总体标准差已知)。若两总体方差相等,则直接用t检验。若总体方差不等,可采用t’检验或变量变换或秩和检验等方法处理。

8:.实验设计的几个原则,要素,方法,适用范围,优缺点?

答:原则:1对照原则2重复原则3随机化原则。

要素:1处理因素2受试对象3实验效应。

方法和优点:1随机对照实验:是将受试对象随机分配到试验组和对照组,通过比较分析回答研究假设的问题,该设计既贯彻了随机化原则,又设有对照。优点是A有效的避免了某些非实验因素的影响B增强了各比较组的可比性,使结论更可靠C有利于所比较总体间存在真实差异D满足了随机化原则,更能反映真实差异。2配对设计:将实验对象按一定条件配成对子,再随机分配每对的两个对象接受不同的处理方式。优点最大限度排除了非处理因素的干扰;降低个体差异水平;提高实验效果;增强均衡性。3交叉设计:是一种特殊的自身对照设计。优点:A节约样本含量B能够控制时间因素及个体差异对处理方式的影响C每个实验对象同时接受了实验因素和对照,考虑了每个患者的利益。4.配伍设计:是将条件相近的实验对象配成一组。优点:增强了各组间的均衡性,可进一步控制混杂性偏倚。

计量数据统计描述和统计图表的是非题

1.       在同一连续分布总体中作随机抽样,理论上样本均数越大,则样本标准差s越大。(错)

2.       在同一连续分布总体中作随机抽样,理论上样本含量n越大,则样本标准差越小(错)

3.       对称分布就是正态分布。(错)

4.       在同一连续分布总体中作随机抽样,理论上样本含量n越大,则样本极差越大。(对)

5.       样本中位数不受样本中的极端值影响。(对)

6.       正态分布资料也可用中位数描述其中集中趋势(中心位置)。(对)

7.       分组的连续分布资料,计算百分位数要求组距相等。(错)

8.       80百分位数ρ80表示有80%变量值比它大。(错)

9.       对于连续分布资料,单位相同时,也可用变异系数比较两个变量的相对离散度。(错)

10.    在同一连续分布总体中作随机抽样,理论上样本含量n越大,则从样本算得的变异系数越小。(错)

11.    对于计量数据,不应按分组方式决定是否计算机和均数。(对)

12.    若男女儿童平均是高接近,可用标准差s来比较其绝对离散度。(

13.    四分位数间距也是描述连续分布数据离散度的指标。(对)

14.    自由度p(-∞,∞)时的t分布就是标准正态分布。(对)

15.    标准正态分布常用N01)表示。(对)

16.    严格地说, 是一定以0为中心,左右对称。(错)

17.    标准差是位置系数。(错)

18.    对于连续分布数据,样本标准差的均数理论上等于总体标准差。(

19.    对于连续分布数据,样本方差的均数理论上等于总体方差。(

20.    只有当样本含量很大时,连续分布数据的样本均数的平均数理论上才等于总体均数。(错)

21.    μ±1.96σ表示任何分布计量指标的95%变量值所在范围。(错)

22.    正态分布总体,理论上PPμ±1.96σ范围是一样的。(对)

23.    直方图是描述连续分布变量频数分布的统计图。(对)

24.    构成比资料可画圆图。(对)

25.    线图可以描述一个计量指标随另一个计量指标变化而变化的趋势。(对)

26.    半对数线图可以描述和比较事物的发展变化的相对速度。(对)

27.    表示某中学高三年级10个班学生近视比例的比较,应用线图(错,条图)

28.    描述200人血压饿分布,应画直图。(错,圆图或百分条图)

29.    在同一正态总体Nμ,σ)中随机抽样,两个变量值X1X2之差d服从正态分布Nμ,σ)(

30.    两正态分布变量XNμ1σ1)和X2Nμ2σ2)之差的方差是σ1222(错)。

31.    比较2000年年底某地三种疾病的患病率,宜绘制之线图。(错,条图)

32.    描述300人肺活量与身高关系可画散点图。(对)

33.    纵坐标取等比尺度而横坐标取等差尺度时的线图成为对数线图。(对)

34.    一般的正常值范围是指95%正常人的该指标所在范围。(对)

35.    理论上正态分布的标准差不会大于平均数。(

36.    变量值有负数时不能直接计算几何均数。(

37.    均数大于0时所计算的变异系数才有意义。(

38.    利用组距不相等的频数分布表资料计算样本均数x和样本标准方差s,宜用加权法。(

39.    在同一连续分布总体中作随机抽样,理论上样本含量n越大,样本四分位数间距越大。(错)

40.    超出95%正常值范围的个体都是异常个体。(错)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多