17日前

EPYNET:衣類セグメンテーションのための効率的ピラミッド型ネットワーク

{Heitor Silvério Lopes, Andrei De Souza Inácio}
要約

人体から抽出されるソフトバイオメトリクス的特徴、例えば服装の種類、髪の色、装飾品などは、人物の追跡および識別に有用な情報として活用されている。これらの特徴を画像からセマンティックセグメンテーションする技術は、衣類のスタイル、重ね着、形状、色の多様性が極めて大きいため、研究者にとって依然として挑戦的な課題である。この課題に対処するため、本研究では衣類セグメンテーションを目的としたEPYNETというフレームワークを提案する。EPYNETは、Single Shot MultiBox Detector(SSD)とFeature Pyramid Network(FPN)を基盤とし、EfficientNetをバックボーンとして採用している。また、データ拡張手法およびノイズ低減技術を統合することで、セグメンテーション精度の向上を図っている。さらに、本研究では新たにUTFPR-SBD3というデータセットを提案した。このデータセットは、18種類の物体クラスおよび背景を含む、合計4,500枚の手動アノテーション画像から構成されており、既存の公開データセットとは異なり、クラス間の分布が不均衡な状態を避け、各クラスに少なくとも100枚のサンプルが存在するように設計されている。これにより、深層学習モデルの学習難易度を低減する効果が期待できる。また、衣類セグメンテーションにおけるデータセットの不均衡度を評価する新たな指標を提案した。この指標により、背景の影響、小物クラス、またはサンプル数が極端に多い・少ないクラスの影響を定量的に検出可能となる。UTFPR-SBD3における実験結果から、EPYNETが公開データセット上での最先端手法を上回る性能を示した。これらの結果から、本研究で提案するアプローチは、ソフトバイオメトリクス、人物監視、画像記述、衣類推薦など、多くの実世界応用分野において有用であると考えられる。