Hello,大家好,我是松哥统计,我们知道变量有3兄弟,老大数值变量、老二等级变量、老三是分类变量。三兄弟中老大数值变量身上包含的信息较多,因此,很多的时候,进行分析时,都是以本尊的形式进行分析。 但是,信息多,有时候也不是好事,比如构建模型时,数值变量从统计上构建没问题,但是从专业上解释,有时候不方便。 比如血液学指标,比如微量元素测定等,如果单位ng/ml。而模型B的解释为X没改变一个单位,Y的平均改变量。 您可以想想,改变1ng/ml,专业上能对Y有多大作用呢?几乎微乎其微。因此,我们常常将数值变量进行离散化,降级化。 其中最简单的就是,分为二分类。 目前文献报道的二分法有参考值法,中位数法、均数法、ROC法。今天松哥看文献,又发现移动切割法,也是一种挺好的思路哈! |
|