在基础统计学中会遇到有一个基本的问题,即在已知一组数据符合正态分布,同时给定算术平均值和标准差的情况下,如何计算该组数据的Z score。Z score,又称标准分数,为该组数据中各个原始数据点脱离该组数据均值的幅度,幅度以标准差为衡量单位。 Z score的计算公式为Z=(x-μ)/σ,其中μ是该组数据的均值,σ是该组数据的标准差,Z是标准分数。很重要的一点是,该计算公式一般是基于该组数据并非样本数据而是数据整体的假设,也就是说不能从一组数据的整体中抽出一部分数据作为样本计算Z score,而只能计算这一整组数据的Zscore。但实际上,不可能对整体数据中的每一个数据都进行统计,因此数据采样是不可避免的。 下面通过例子来说明。 问题一、假设一个班级某次考试的平均分为80分,标准差为6,那么分数为75的学生的Z score是多少? 答案是:该学生的Z score=(75-80)/6=-5/6=-0.833。 问题二、在2018年9月10日至9月21日期间标准普尔500指数共有10个收盘价,如何计算这十个交易日收盘价的Z score? 第一步,计算标准差,因为用的是样本数据,因此在方差和标准差计算过程中分母为10-1,如果用的是数据的整体,那么分母应为10,请注意这两种计算方法之间的微小区别 第二步,有了标准差的计算结果,就可以用每个交易日对应的离均差除以标准差17.6617得出该交易日收盘价的Zscore。 以下为各交易日收盘价的Z score分布情况,其中2018年9月10日的收盘价在这十日收盘价均值之下约-1.43个标准差的位置上,2018年9月20日的收盘价在这十日收盘价均值之上约1.60个标准差的位置上,而2018年9月13日的收盘价偏离这十日收盘价均值的程度很小,仅相当于0.10个标准差。 下面再用西德克萨斯轻质原油的案例验证一下,数据取值日期也是2018年9月10日至9月21日期间,计算这十个交易日收盘价的Z score? 第一步还是计算标准差,结果如下: 第二步 计算标准分数Z score 各交易日收盘价的Z score分布情况 |
|