HyperAIHyperAI

Command Palette

Search for a command to run...

OneNet:一种通道感知的一维卷积U-Net

Sanghyun Byun Kayvan Shah Ayushi Gang Christopher Apton Jacob Song Woo Seong Chung

摘要

许多先进的计算机视觉架构采用U-Net,因其具备良好的适应性与高效的特征提取能力。然而,其多分辨率卷积设计通常带来较大的计算开销,限制了在边缘设备上的部署。为此,我们提出一种简化替代方案:一种基于一维卷积的编码器结构,在保持精度的同时显著提升了在边缘场景下的适用性。我们提出的新型编码器架构通过通道维度的一维卷积与像素反洗(pixel-unshuffle)操作相结合,实现语义分割。通过引入PixelShuffle技术——该技术在超分辨率任务中已被证实可提升精度并降低计算负担——OneNet能够在不依赖二维卷积的情况下有效捕捉空间关系,参数量最多可减少47%。此外,我们还探索了一种全一维编码器-解码器结构,其模型尺寸缩减达71%,尽管伴随一定程度的精度下降。我们在多种掩码生成任务中对本方法与U-Net系列变体进行了基准测试,结果表明,OneNet在保持高精度方面表现优异。尽管本研究聚焦于图像分割任务,但该架构具备良好的可扩展性,可适配其他卷积类应用。项目代码已开源,地址为:https://github.com/shbyun080/OneNet


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供