2ヶ月前

PCPL: バイアスのないシーングラフ生成のための述語相関知覚学習

Shaotian Yan; Chen Shen; Zhongming Jin; Jianqiang Huang; Rongxin Jiang; Yaowu Chen; Xian-Sheng Hua
PCPL: バイアスのないシーングラフ生成のための述語相関知覚学習
要約

今日、シーングラフ生成(Scene Graph Generation: SGG)タスクは現実的なシナリオにおいて大きく制限されており、主に述語アノテーション分布の極端な長尾偏りが原因となっています。したがって、SGGにおけるクラス不均衡問題を解決することは重要かつ困難です。本論文では、まず述語ラベル同士が強い相関を持つ場合、一般的な再平衡化戦略(例:再サンプリングや再重み付け)が尾部データへの過学習(例:ベンチが歩道上にあるという正解ではなく、ベンチが座っていると誤認識)を引き起こすか、または元の不均一な分布からの悪影響を受け続ける(例:異なる「駐車している」「立っている」「座っている」を単純に「〜上にある」と集約)ことを発見しました。私たちは、これらの再平衡化戦略が述語の頻度には敏感である一方で、その関連性には無頓着であり、述語特徴の学習促進においてより重要な役割を果たす可能性があると考えています。そこで、新たな述語相関知覚学習(Predicate-Correlation Perception Learning: PCPLと略します)スキームを提案します。このスキームは直接述語クラス間の相関を感知し利用することで適切な損失重みを自動的に探索します。さらに、PCPLフレームワークはコンテキスト特徴をより効果的に抽出するためのグラフエンコーダーモジュールも装備しています。基準となるVG150データセットでの広範な実験結果から、提案されたPCPLは尾部クラスにおいて著しく優れた性能を示し、頭部クラスの性能も良好に保つことができることが確認されました。これは以前の最先端手法よりも大幅に優れていることを示しています。

PCPL: バイアスのないシーングラフ生成のための述語相関知覚学習 | 最新論文 | HyperAI超神経