マクロ-マイクロ敵対ネットワークによる人間の解析

人間パーシングにおいて、ピクセル単位の分類損失には低レベルの局所的非一貫性と高レベルの意味的非一貫性という欠点があります。敵対ネットワークの導入は、単一の識別器を使用してこれらの2つの問題に対処しますが、2種類のパーシング非一貫性は異なるメカニズムによって生成されるため、単一の識別器では両方を解決することが困難です。本論文では、これら2つの非一貫性を解消するためにマクロ・マイクロ敵対ネットワーク(Macro-Micro Adversarial Net: MMAN)を提案します。MMANには2つの識別器が含まれています。1つ目の識別器であるマクロDは、低解像度ラベルマップに対して作用し、意味的な非一貫性(例:誤った位置付けされた身体部位)を罰則として適用します。もう1つ目の識別器であるマイクロDは、高解像度ラベルマップの複数の領域に焦点を当て、局所的な非一貫性(例:ぼかしや穴)に対処します。従来の敵対ネットワークと比較して、MMANは局所的一貫性と意味的一貫性を明示的に強制するだけでなく、高解像度画像を扱う際の敵対ネットワークの収束不良問題も回避できます。実験では、2つの識別器が互いに補完し合い人間パーシング精度を向上させることを確認しました。提案したフレームワークは最新手法と競合するパーシング性能を発揮できることを示しており、LIPデータセットでmIoU=46.81%、PASCAL-Person-PartデータセットでmIoU=59.91%という結果を得ました。相対的に小さなデータセットPPSSでも、事前学習済みモデルが優れた汎化能力を持っていることを示しています。コードは公開されており、以下のURLからアクセスできます:https://github.com/RoyalVane/MMAN。この翻訳では以下の点に注意しました:1. 専門用語や技術的概念(例:人間パーシング, ピクセル単位の分類損失, 敵対ネットワーク, 識別器, ラベルマップ, 局所的一貫性, 意味的一貫性, mIoU)について一般的な日本語訳を使用しました。2. 用語や文章構造は日本語の表現習慣に合わせて調整し、自然な読みやすさを目指しました。3. 正式かつ客観的な書き方で翻訳を行い、口語的な表現は避けました。4. 原文との内容の一貫性を保ちつつ、日本語読者にとってより理解しやすいように文章構造を最適化しました。