
摘要
实时真实视频去模糊任务由于模糊在空间和时间上的复杂变化特性,以及对低计算成本的严格要求,至今仍是一项极具挑战性的任务。为提升网络效率,本文在RNN单元中引入残差密集块(residual dense blocks),以高效提取当前帧的空间特征。此外,提出一种全局时空注意力模块,用于融合前后帧中的有效分层特征,从而更优地恢复当前帧的清晰图像。另一个亟待解决的问题是缺乏真实世界基准数据集。为此,本文构建了一个新型数据集(BSD),通过共轴分光镜采集系统获取成对的模糊/清晰视频片段,为社区贡献了这一宝贵资源。实验结果表明,所提出的ESTRNN方法在定量与定性评价上均优于当前最先进的视频去模糊方法,同时具有更低的计算开销。此外,跨数据集的交叉验证实验进一步验证了BSD数据集相较于合成数据集具有更高的泛化能力。相关代码与数据集已开源,地址为:https://github.com/zzh-tech/ESTRNN。