
要約
本稿では、単一画像からオクルージョンに強い3次元人体メッシュ再構成を実現する、シンプルでありながら効果的な手法を提案する。近年の多くの研究により、人体メッシュ再構成の性能は顕著に向上しているが、人物間のオクルージョンが発生する状況下では、各身体部位がどの人物に属するかという曖昧性により、正確なメッシュ生成は依然として困難である。この問題に対処するため、本研究ではインスタンスに意識的な対照学習(instance-aware contrastive learning)スキームを提案する。具体的には、対象人物に属する関節特徴量を、アンカー特徴量(すなわち、身体中心位置から抽出された特徴量)と近接するように学習する。一方で、異なる人物インスタンスのアンカー特徴量同士は遠く離れるように制約することで、各人物の関節特徴量が他の人物と明確に区別されるようにする。この対照学習スキームに基づいて関節の所属関係を解釈することで、与えられた画像内における各人物の身体部位の空間的占有状態を容易に理解でき、複数人物間で重度に重なり合う場合でも信頼性の高い人体メッシュの再構成が可能となる。標準ベンチマークデータセット上での実験結果により、従来手法と比較して、人物間オクルージョン下でも本手法の優れたロバスト性が確認された。コードおよびモデルは、以下のURLで公開されている:https://github.com/DCVL-3D/InstanceHMR_release。