
摘要
无人水下图像分析在海洋监测中面临两大挑战:(i)由于光衰减导致的图像质量下降和(ii)硬件存储限制制约了高分辨率图像的采集。现有的方法主要集中在通过存储全尺寸输入来改善图像质量。相比之下,我们提出了一种新型架构——胶囊增强变分自编码器(Capsule Enhanced Variational AutoEncoder,简称CE-VAE),该架构旨在高效压缩和增强退化的水下图像。我们的注意力感知图像编码器能够在远程设备上在线运行,同时将输入图像投影到潜在空间表示。设备上或发送至信标所需的唯一信息是压缩后的表示。此外,还设计了一个双解码模块,用于离线生成全尺寸增强图像。其中一个分支从压缩的潜在空间重建空间细节,而另一个分支则利用胶囊聚类层捕捉实体级结构和复杂的空间关系。这种并行解码策略使模型能够在精细细节保留与上下文感知增强之间取得平衡。CE-VAE在六个基准数据集上的水下图像增强性能达到了当前最佳水平,其压缩效率比现有方法最高可提高3倍。代码已发布在\url{https://github.com/iN1k1/ce-vae-underwater-image-enhancement}。