Command Palette
Search for a command to run...
University-1652: ドローンを用いたジオローケーションのためのマルチビュー・マルチソースベンチマーク
University-1652: ドローンを用いたジオローケーションのためのマルチビュー・マルチソースベンチマーク
Zhedong Zheng Yunchao Wei Yi Yang
概要
視点間の地理的位置特定問題について考察する。この課題の主な難しさは、大きな視点変化に対して堅牢な特徴を学習することにある。既存のベンチマークは役立つが、視点の数に制限がある。画像ペア(例えば、衛星と地上からの2つの視点)が通常提供されるが、これにより特徴学習が妥協される可能性がある。本論文では、スマートフォンカメラや衛星だけでなく、ドローンも地理的位置特定問題に対処する第三のプラットフォームとして機能しうると主張する。伝統的な地上からの画像とは異なり、ドローンからの画像は木々などの障害物に阻まれることが少なく、目標地点周辺を飛行することで包括的な視野を提供できる。ドローンプラットフォームの有効性を検証するために、ドローンベースの地理的位置特定用の新しいマルチビュー・マルチソースベンチマークであるUniversity-1652を導入する。University-1652には、世界中の1,652大学建物から得られる3つのプラットフォーム(合成ドローン、衛星、地上カメラ)のデータが含まれている。当該データセットは、我々の知る限り初めてのドローンベースの地理的位置特定データセットであり、ドローンビューによる目標位置特定とドローンナビゲーションという2つの新たな課題を可能にする。その名が示すように、ドローンビューによる目標位置特定はドローンビュー画像を通じて目標地点の位置を予測することを目指す。一方で、衛星ビューからの照会画像が与えられた場合、ドローンナビゲーションはドローンを照会画像に示された関心領域まで誘導することを目指す。このデータセットを使用して、様々な市販CNN特徴量を分析し、挑戦的なUniversity-1652データセット上で強力なCNN基準モデルを提案する。実験結果は、University-1652がモデルに視点不変特徴量を学習させることができることを示しており、現実世界での良好な汎化能力も持っていることが確認された。