数据挖掘之归一化

心不留意外尘 2016-08-04

展开全文

http://jianchen./blog/1684609

2012

在阅读数据模型的文章中，经常看到针对特征维度进行归一化处理。

归一化的定义：

一种简化计算的方式，将有量纲的表达式，经过变换，化为无量纲的表达式，成为纯量，避免具有不同物理意义和量纲的输入变量不能平等使用。在统计学中，归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布，归一化在-1--+1之间是统计的坐标分布。

归一化处理后，神经网络算法可以较好的收敛。

常见的归一化的函数如下

1,线性函数转换，表达式如下：

　　y=(x-MinValue)/(MaxValue-MinValue)　　

说明：x、y分别为转换前、后的值，MaxValue、MinValue分别为样本的最大值和最小值。

2,对数函数转换，表达式如下

y=log10(x)　　说明：以10为底的对数函数转换。

3、反正切函数转换，表达式如下

　　y=atan(x)*2/PI

归一化的具体方法根据你的样本特征，需要选择恰当的方法。

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：心不留意外尘 > 《基构变换》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

心不留意外尘

关注对话

喜欢该文的人也喜欢更多

热门阅读换一换