归一化 Normalization

归一化通过将数据映射到指定范围,用于去除不同维度数据的量纲及量纲单位,并挺高不同数据指标之间的可比性,常见的映射范围有 [ 0 , 1 ] 和 [ -1 , 1 ]。

归一化算法

  • 线性转换:y = ( x – min ) / ( max – min )
  • 对数函数转换:y = log_{10} ( x )
  • 反余切函数转换:y = arctan ( x ) * 2 / π

归一化和其他算法对比

目前主要的数据处理方法有归一化、标准化和正则化。

  • 归一化是为了消除不同数据之间的量纲,方便数据比较和共同处理;
  • 标准化是为了方便数据的下一步处理,而进行的数据缩放等变换;
  • 正则化是利用先验知识,在处理过程中引入正则化因子以增加引导约束的作用。
相关词:标准化、正则化