HyperAIHyperAI

Command Palette

Search for a command to run...

拡張スパインネットによるセマンティックセグメンテーション

Abdullah Rashwan Xianzhi Du Xiaoqi Yin Jing Li

概要

スケール順序入れ替えネットワーク(Scale-permuted networks)は、物体のバウンディングボックス検出およびインスタンスセグメンテーションにおいて有望な結果を示している。スケール順序の入れ替えとクロススケール融合により、ネットワークはマルチスケールの意味情報を捉えつつ、空間解像度を保持することが可能となる。本研究では、このメタアーキテクチャ設計を、高空間解像度と異なるネットワーク段階におけるマルチスケール特徴融合が利点となるもう一つの視覚タスクであるセマンティックセグメンテーションに適用した。さらに、拡張畳み込み(dilated convolution)操作を活用することで、DeepLabv3システムからNAS(Neural Architecture Search)によって発見されたSpineNet-Segを提案する。SpineNet-Segは、セマンティックセグメンテーションタスクに最適化された、各ブロックごとにカスタマイズされた拡張率を持つより優れたスケール順序入れ替えネットワーク構造を採用している。SpineNet-Segモデルは、複数の代表的なベンチマークにおいて、すべてのモデルスケールでDeepLabv3/v3+ベースラインを速度および精度の両面で上回っている。特に、SpineNet-S143+モデルは、代表的なCityscapesベンチマークにおいて83.04%のmIoUを達成し、新たなSOTA(最先端)を記録した。また、PASCAL VOC2012ベンチマークでも85.56%のmIoUという優れた性能を示した。さらに、挑戦的なStreet Viewセグメンテーションデータセットにおいても、有望な結果を達成している。コードおよびモデルチェックポイントは、公開予定である。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています