2ヶ月前

CPlaNet: 地図の組合せ分割による画像ジオローカライゼーションの向上

Paul Hongsuck Seo; Tobias Weyand; Jack Sim; Bohyung Han
CPlaNet: 地図の組合せ分割による画像ジオローカライゼーションの向上
要約

画像の地理位置特定とは、写真に映っている場所をその視覚的情報のみに基づいて識別することです。このタスクは、多くの写真が地理的位置を示すわずかで曖昧な手がかりしか持たないため、本質的に困難です。最近の研究では、地球を地理的地域に対応する一連の離散的なセルに分割することで、このタスクを分類問題として扱っています。この分割の粒度は重要なトレードオフを呈します;少ないが大きなセルを使用すると位置精度が低下し、多いが小さなセルを使用すると各クラスの学習例数が減少し、モデルサイズが増大して過学習しやすくなります。この課題に対処するために、私たちは単純ながら効果的なアルゴリズムである組合せ分割法(combinatorial partitioning)を提案します。この方法は、地球の複数の粗分割を交差させることで多数の細かい出力クラスを生成します。各分類器は、それぞれの粗分割と重なる細かいクラスに投票します。これにより、十分な学習例数を維持しながら微細なスケールでの位置予測を行うことが可能になります。私たちのアルゴリズムは、複数のベンチマークデータセットにおいて位置認識における最先端性能を達成しています。

CPlaNet: 地図の組合せ分割による画像ジオローカライゼーションの向上 | 最新論文 | HyperAI超神経