2ヶ月前
OpenStreetView-5M: グローバル視覚地理位置のための多様な道
Guillaume Astruc; Nicolas Dufour; Ioannis Siglidis; Constantin Aronssohn; Nacim Bouia; Stephanie Fu; Romain Loiseau; Van Nguyen Nguyen; Charles Raude; Elliot Vincent; Lintao XU; Hongyu Zhou; Loic Landrieu

要約
地球上の任意の場所にある画像の位置を特定することは、複雑な視覚的な課題であり、これによりコンピュータビジョンアルゴリズムの評価が特に重要となります。しかし、信頼性のある位置情報を持つ標準的大規模オープンアクセスデータセットの不在により、その可能性は制限されてきました。この問題に対処するため、私たちはOpenStreetView-5M(OSV-5M)を導入します。これは、225カ国および地域をカバーし、510万枚以上のジオリファレンスされたストリートビュー画像から構成される大規模オープンアクセスデータセットです。既存のベンチマークと異なり、厳格な学習用/テスト用データの分離を行っています。これにより、単なる記憶化を超えた学習された地理的特徴の関連性を評価することが可能になります。当該データセットの有用性を示すために、最先端の画像エンコーダー、空間表現方法、および学習戦略について広範なベンチマークを行いました。関連するすべてのコードとモデルは以下のURLで公開されています: https://github.com/gastruc/osv5m.