Command Palette
Search for a command to run...
DOTA: Ein umfangreiches Datensatz für die Objekterkennung in Luftbildern
DOTA: Ein umfangreiches Datensatz für die Objekterkennung in Luftbildern
Gui-Song Xia Xiang Bai Jian Ding Zhen Zhu Serge Belongie Jiebo Luo Mihai Datcu Marcello Pelillo Liangpei Zhang
Zusammenfassung
Objekterkennung ist ein wichtiges und herausforderndes Problem im Bereich der Computer Vision. Obwohl in den letzten zehn Jahren große Fortschritte bei der Objekterkennung in natürlichen Szenen gemacht wurden, konnten diese Erfolge auf Luftbildern nur langsam repliziert werden. Dies liegt nicht nur an der enormen Variation von Skala, Orientierung und Form der Objektinstanzen auf der Erdoberfläche, sondern auch an dem Mangel an gut annotierten Datensätzen von Objekten in Luftbildszenen. Um die Forschung zur Objekterkennung in Earth Vision, auch bekannt als Erdbeobachtung und Fernerkundung, voranzubringen, stellen wir einen umfangreichen Datensatz für die Objekterkennung in Luftbildern (DOTA) vor.Dazu sammeln wir 2806 Luftbilder aus verschiedenen Sensoren und Plattformen. Jedes Bild hat eine Größe von etwa 4000 mal 4000 Pixeln und enthält Objekte mit einer breiten Vielfalt an Skalen, Orientierungen und Formen. Diese DOTA-Bilder werden dann von Experten für die Interpretation von Luftbildern unter Verwendung von 15 gängigen Objektkategorien annotiert. Der vollständig annotierte DOTA-Datensatz enthält 188.282 Instanzen, wobei jede Instanz durch ein beliebiges (8 Freiheitsgrade) Quadrilateral gekennzeichnet ist.Um eine Referenzlinie für die Objekterkennung in Earth Vision zu schaffen, evaluieren wir fortschrittliche Objekterkennungsalgorithmen auf DOTA. Die Experimente zeigen, dass DOTA realistische Anwendungen der Erdbeobachtung gut repräsentiert und äußerst anspruchsvoll ist.