11 天前
OneNet:一种通道感知的一维卷积U-Net
Sanghyun Byun, Kayvan Shah, Ayushi Gang, Christopher Apton, Jacob Song, Woo Seong Chung

摘要
许多先进的计算机视觉架构采用U-Net,因其具备良好的适应性与高效的特征提取能力。然而,其多分辨率卷积设计通常带来较大的计算开销,限制了在边缘设备上的部署。为此,我们提出一种简化替代方案:一种基于一维卷积的编码器结构,在保持精度的同时显著提升了在边缘场景下的适用性。我们提出的新型编码器架构通过通道维度的一维卷积与像素反洗(pixel-unshuffle)操作相结合,实现语义分割。通过引入PixelShuffle技术——该技术在超分辨率任务中已被证实可提升精度并降低计算负担——OneNet能够在不依赖二维卷积的情况下有效捕捉空间关系,参数量最多可减少47%。此外,我们还探索了一种全一维编码器-解码器结构,其模型尺寸缩减达71%,尽管伴随一定程度的精度下降。我们在多种掩码生成任务中对本方法与U-Net系列变体进行了基准测试,结果表明,OneNet在保持高精度方面表现优异。尽管本研究聚焦于图像分割任务,但该架构具备良好的可扩展性,可适配其他卷积类应用。项目代码已开源,地址为:https://github.com/shbyun080/OneNet。