分享

数据没有超过3个标准差,就不是异常值吗?

 松哥精鼎统计 2020-10-23

科研数据处理时,很多学者把数据中超过3个标准差的就当做是异常值,没有超过就认为是正常值。是不是呢?看看吧!

1
先看一组数据吧

下表为10个数据,1-9,最大值为1000000,很显然一百万是异常值,下面我们看看标准差情况。


2
描述一下,看结果


大家看一下均值=100004.5,标准差=316226.185,那么均数加3个标准差=1048683.055,远远高于1000000.意思是1000000没有超过3个标准差,尚不能认为是异常值呢!




松哥:采用3个标准差进行异常值的判定是有条件的,忽视条件,必然有失偏颇。条件是:一、资料必须符合正态分布;二、样本量应该足够大。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多