HyperAIHyperAI

Command Palette

Search for a command to run...

BiSeNet:用于实时语义分割的双边分割网络

Changqian Yu∗1[0000−0002−4488−4157] Jingbo Wang∗2[0000−0001−9700−6262] Chao Peng3[0000−0003−4069−4775] Changxin Gao∗∗1[0000−0003−2736−3920] Gang Yu3[0000−0001−5570−2710] Nong Sang1[0000−0002−9167−1496]

摘要

语义分割需要丰富的空间信息和较大的感受野。然而,现代方法通常为了实现实时推理速度而牺牲空间分辨率,这导致了性能较差。在本文中,我们通过提出一种新颖的双边分割网络(Bilateral Segmentation Network, BiSeNet)来解决这一困境。首先,我们设计了一个小步幅的空间路径(Spatial Path),以保留空间信息并生成高分辨率特征。同时,采用快速下采样策略的上下文路径(Context Path)被用来获得足够的感受野。在此基础上,我们引入了一种新的特征融合模块(Feature Fusion Module),以高效地结合特征。所提出的架构在Cityscapes、CamVid和COCO-Stuff数据集上实现了速度与分割性能之间的良好平衡。具体而言,对于2048x1024的输入图像,我们在单个NVIDIA Titan XP显卡上达到了每秒105帧的速度,并在Cityscapes测试数据集上获得了68.4%的平均交并比(Mean IOU),显著快于具有类似性能的现有方法。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供