平滑 Smoothing
平滑是一种常用的数据处理方式,统计学和图像处理中,通常会建立近似函数抓住数据中的主要模式,以去除噪音、结构细节或瞬时现象,以平滑一个数据集。
在平滑过程中,信号数据点会被修改,噪音产生的单独数据点被降低,而低于毗邻数据点的部分会提升,从而得到一个更为平滑的信号。
平滑的方式
将平滑用于数据分析主要有以下两点:
- 若平滑的假设是合理的,则可从数据中获得更多信息;
- 提供灵活而且稳健的分析,目前有许多不同的算法用于平滑,但数据平滑通常利用密度估计、直方图完成。
平滑的算法
- 移动平均:通常被用于在重复的统计调查中捕获重要趋势。在图像处理和计算机视觉中,平滑被用于尺度空间的表示。
- 直角平滑/无加权平滑:用 m 个连接点的平均值替换信号中的点,m 是称为「平滑宽度」的正整数,通常是奇数。
平滑的具体应用
- Additive smoothing
- Good-Turing estimate
- Jelinek-Mercer smoothing ( interpolation )
- Katz smoothing ( backoff )
- Witten-Bell smoothing
- Absolute discounting
- Kneser – Ney smoothing