17日前

サポートセットのコンテキストは、ボンガード問題において重要である

Nikhil Raghuraman, Adam W. Harley, Leonidas Guibas
サポートセットのコンテキストは、ボンガード問題において重要である
要約

現在の機械学習手法は、正例と負例の「サポート画像」の集合から抽象的な「概念」を導出し、新しいクエリ画像がその核心概念を表しているかどうかを分類する必要がある、ボンガード問題(Bongard problems)と呼ばれる知能検査の一種を効果的に解くことができない。自然画像を対象としたボンガード問題のベンチマークであるBongard-HOIにおいて、現存する大多数の手法は最高でも69%の精度にとどまっており(ランダムに予測した場合の期待値は50%)、その低さはニューラルネットワークが人間のような記号的ルールを発見する能力に欠けることにあると一般的に指摘されている。本研究では、この低精度の原因として、より単純な問題が隠れていることを指摘する。すなわち、多くの既存手法は、サポートセット全体に含まれる情報を統合的に活用せずに、個々のサポート画像から抽出された情報を頼りにしている点にある。これは極めて重要な問題である。なぜなら、典型的なボンガード問題における「核心概念」は、単一の正例や負例では識別できないことが多く、複数の正例と複数の負例を組み合わせて初めて明確に区別可能となるからである。本研究では、このような文脈情報を適切に統合する簡単な手法を検討し、従来手法に比べて顕著な性能向上を実現した。これにより、同等の視覚バックボーンアーキテクチャを用いながらも、元のボンガード問題セットで60.8%の高い性能を示す手法と比較して、Bongard-LOGOでは75.3%、Bongard-HOIでは76.4%という新たなSOTA(State-of-the-Art)精度を達成した。

サポートセットのコンテキストは、ボンガード問題において重要である | 最新論文 | HyperAI超神経