
摘要
典型的卷积神经网络是在RGB图像上进行训练和测试的。然而,在实际应用中,为了节省内存和高效传输,图像通常会被压缩。本文探讨了在JPEG标准定义的离散余弦变换(DCT)表示上执行语义分割的方法。我们首先重新排列DCT系数以形成一种优选的输入类型,然后对现有的网络进行调整以适应DCT输入。所提出的方法在网络复杂度大致相同的情况下,其准确性接近RGB模型。此外,我们研究了选择不同的DCT分量对分割性能的影响。通过合理的选择,可以仅使用36%的DCT系数达到相同的准确率水平。我们进一步展示了该方法在量化误差下的鲁棒性。据我们所知,这是首篇探索在DCT表示上进行语义分割的研究论文。