归一化通过将数据映射到指定范围,用于去除不同维度数据的量纲及量纲单位,并挺高不同数据指标之间的可比性,常见的映射范围有 [ 0 , 1 ] 和 [ -1 , 1 ] 。
归一化算法
- 线性转换:$latex y = ( x – min ) / ( max – min )$
- 对数函数转换:$latex y = log_{10} ( x ) $
- 反余切函数转换:$latex y = arctan ( x ) * 2 / π$
归一化和其他算法对比
目前主要的数据处理方法有归一化、标准化和正则化。
- 归一化是为了消除不同数据之间的量纲,方便数据比较和共同处理;
- 标准化是为了方便数据的下一步处理,而进行的数据缩放等变换;
- 正则化是利用先验知识,在处理过程中引入正则化因子以增加引导约束的作用。
相关词:标准化、正则化