一、离散系数的定义 离散系数又称变异系数,是衡量资料中各观测值变异程度的一个统计量。当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数(均值)的比值(相对值)来比较。 1.离散系数指标 离散系数指标有:全距(极差)系数、平均差系数、方差系数和标准差系数等。常用的是标准差系数,用CV(Coefficient of Variance)表示。 CV(Coefficient of Variance):标准差与均值的比值。 用公式表示为:CV=σ/μ 方差(Variance)和标准差(Standard Deviation)是测算离散趋势最重要、最常用的指标。方差是各变量值与其均值离差平方的平均数,它是测算数值型数据离散程度的最重要的方法。标准差为方差的算术平方根,用S表示。标准差与方差不同的是,标准差和变量的计算单位相同,比方差清楚,所以很多时候我们分析的时候更多的使用的是标准差。因此,标准差是反映一组数据离散程度最常用的一种量化形式,是表示精密确的最重要指标。 方差:s2=[(x1–x)2 +(x2–x)2 +......(xn–x)2]/n (x为平均数) 例如:4,8,6,2,方差为5,平均数是5。 标准差=方差的算术平方根。SD=sqrt{[(x1–x)2 + (x2–x)2 + ...... (xn–x)2]/(n–1)}。(说明:sqrt为开根号。若为样本,除以(n–1);若为全体数据,除以n) 2.计算公式 极差(全距)系数:Vr=R/X′; 平均差系数:Va,d=A.D/X′; 方差系数:V方差=方差/X′; 标准差系数:V标准差=标准差/X′; 其中,X′表示X的平均数。 二、离散系数的用途和意义 离散系数反映单位均值上的离散程度,常用在两个总体均值不等的离散程度的比较上。若两个总体的均值相等,则比较标准差系数与比较标准差是等价的。 一组数据的标准差与其相应的均值之比,是所测定数据离散程度的相对指标,其作用主要是用于比较不同组别数据的离散程度。其计算公式为v=S/(X的平均值)。 标准变异系数是一组数据的变异指标与其平均指标之比,它是一个相对变异指标。 三、一组数据如何计算它的离散度 1.极差 最直接也是最简单的方法,即最大值-最小值(也就是极差)来评价一组数据的离散度。这一方法最为常见,比如比赛中去掉最高最低分就是极差的具体应用。 2.离均差的平方和 由于误差的不可控性,因此只由两个数据来评判一组数据是不科学的。所以人们在要求更高的领域不使用极差来评判。其实,离散度就是数据偏离平均值的程度。因此将数据与均值之差(我们叫它离均差)加起来就能反映出一个准确的离散程度,越大离散度也就越大。 3.方差(S2) 由于离均差的平方累加值与样本个数有关,只能反应相同样本的离散度,而实际工作中做比较很难做到相同的样本,因此为了消除样本个数的影响,增加可比性,将标准差求平均值,这就是我们所说的方差成了评价离散度的较好指标。 我们知道,样本量越大越能反映真实的情况,而算数均值却完全忽略了这个问题,对此统计学上早有考虑,在统计学中样本的均差多是除以自由度(n–1),它的意思是样本能自由选择的程度。当选到只剩一个时,它不可能再有自由了,所以自由度是n–1。 4.标准差(SD) 由于方差是数据的平方,与检测值本身相差太大,人们难以直观的衡量,所以常用方差开根号换算回来这就是我们要说的标准差。 附:标准分常模 (一)标准分常模简介 1.标准分常模的概念 标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分数。常见的标准分常模有:z分数、Z分数、T分数、标准九分数、离差智商(IQ)等。标准分常模分数均是等距分数,虽然不同类型的常模其平均数和标准差不同,但均可用离均值来表示。标准分数可以通过线性转换,也可以通过非线性转换得到,由此可将标准分数分为线性转换的标准分数与非线性转换的标准分数。 2.标准分常模的局限性 标准化常模表示的是存在状态之间的横向比较,离开原常模样本,不同常模样本之间的比较就没有意义。 3.相关名称 z分数、z′分数、T分数、标准九、标准十、标准二十的平均数:0 50 5 5.5 10,标准差:1 10 2 1.5 3 (二)线性转换的标准分——z分数 1.公式:z =(X-x)/SD X为原始分, x为样本平均数,SD为样本标准差。从公式看,z的含义是:它表示某一分数与均匀数之差是标准差的多少倍。 2.z的性质 (1)平均数为0,标准差为1。 (2)z分数有正、负,其相对值表示原始分与平均数间的间隔正值表示原始分大于平均数,负值则相反。 (3)z分数的分布形态与原始分分布一致。 (三)非线性转换的标准分 1.计算步骤 当原始分数不是常态分布时,也可以使之常态化,这一转换过程就是非线性的。常态化的过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的离均值,并可以表示为任何平均数和标准差。计算步骤如下:(1)对每个原始分数值计算累积百分比;(2)在常态曲线面积表中,求出对应于该百分比的z分数。 所得z分数可将分布分成几部分,我们称之为z′分数,以区别由线性转换所求得的z分数。 2.T分数 T分数是平均数为50,标准差为10的分数。即这一词最早由麦柯尔于1939年提出,是为了纪念推孟和桑代克对智力测验,尤其是提出智商这一概念所作出的巨大贡献。 3.标准九 标准九是标准化九分制的简称。它是以5为平均数,以2为标准差的一个分数量表,最早时被普遍运用于美国空军的心理测验中。 标准九分数也是一种标准分,它将原始分划分为9全体,最高是9分,最低1分。除1和9的范围略大以外,其余均是以5为核心向两边各包含0.5个标准差的分数段。 (四)有关数据解读 1.平均分反映得分程度,与试卷难度有关。不同学科不同考试不可以比较。 2.T标准分反映排序,不同学科、不同考试可以相对比较,换算公式如下: 通过转换后得到的标准分Z在一般情况下都带小数,而且会出现负值,实际使用时不太方便,所以还要对Z分数进行线性变换(T变换): T=500 + 100 * Z (T分数) Z=(X-x)/SD (各字母的含义请见(二)部分) 3.优秀率与及格率划线分数固定,以满分100分为例,90为优秀线,60为及格线,若满分不是100分,将按比例进行换算,优秀线和及格线也进行相应比例的变化。 4.前20%、后20%是相对排名,全区(一个大区域)比率固定,可以跨学科比较、跨年级比较。班级报表的前20%与后20%是以校为一个小区域进行设定。 |
|