HyperAIHyperAI
vor 2 Monaten

CPlaNet: Die Geolokalisierung von Bildern durch kombinatorische Kartenteilung verbessern

Paul Hongsuck Seo; Tobias Weyand; Jack Sim; Bohyung Han
CPlaNet: Die Geolokalisierung von Bildern durch kombinatorische Kartenteilung verbessern
Abstract

Die Geolokalisierung von Bildern ist die Aufgabe, den in einem Foto dargestellten Ort ausschließlich anhand seiner visuellen Informationen zu identifizieren. Diese Aufgabe ist von Natur aus herausfordernd, da viele Fotos nur wenige, möglicherweise mehrdeutige Hinweise auf ihren Standort enthalten. Kürzliche Arbeiten haben diese Aufgabe als Klassifikationsproblem formuliert, indem sie die Erdoberfläche in eine Reihe diskreter Zellen unterteilten, die geografischen Regionen entsprechen. Die Feinheit dieser Unterteilung stellt eine kritische Balance dar: Weniger aber größere Zellen führen zu einer geringeren Ortsgenauigkeit, während mehr aber kleinere Zellen die Anzahl der Trainingsbeispiele pro Klasse verringern und die Modellgröße erhöhen, was das Modell anfällig für Überanpassung macht. Um dieses Problem anzugehen, schlagen wir einen einfachen aber effektiven Algorithmus vor, nämlich kombinatorische Partitionierung (combinatorial partitioning), der durch den Schnitt mehrerer grobkörniger Unterteilungen der Erdoberfläche eine große Anzahl feinkörniger Ausgabeklassen erzeugt. Jeder Klassifikator stimmt für die feinkörnigen Klassen ab, die mit ihren jeweiligen grobkörnigen übereinstimmen. Diese Technik ermöglicht es uns, Orte auf einer feinen Skala vorherzusagen, während wir gleichzeitig genügend Trainingsbeispiele pro Klasse beibehalten können. Unser Algorithmus erreicht den aktuellen Stand der Technik bei der Ortsidentifizierung in mehreren Benchmark-Datensätzen.

CPlaNet: Die Geolokalisierung von Bildern durch kombinatorische Kartenteilung verbessern | Neueste Forschungsarbeiten | HyperAI