
要約
オブジェクト永続性(Object Permanence)とは、目に見えない物体についても、それらが直接知覚されていなくても依然として存在し続けることを理解することで、その位置を推論する能力を指す。自然な視覚シーンにおいて物体は動的に遮蔽されたり、互いに包含されたりするため、世界のモデルを構築する上でオブジェクト永続性は不可欠である。発達心理学における多数の研究は、オブジェクト永続性が経験を経て習得される難しい認知タスクであることを示唆している。本研究では、データからオブジェクト永続性を学習するための設定を提示する。この学習問題を、物体が(1)可視、(2)遮蔽されている、(3)他の物体に包含されている、(4)包含物体によって運ばれているという4つの状況に分解する理由を説明する。特に、(4)のサブタスク、すなわちターゲット物体が包含物体によって運ばれる状況は、見えない物体の移動する位置について推論する必要があるため、極めて挑戦的である。その後、これらの4つの状況において物体の位置を予測する能力を学習する統一的な深層アーキテクチャを提案する。本研究では、CATERに基づく新しいデータセットを用いてこのアーキテクチャとシステムを評価した結果、従来の位置推定手法およびさまざまなベースラインに対して優れた性能を発揮することが確認された。