DISK: Lernen lokaler Merkmale mit Policy-Gradienten

Lokale Merkmalsrahmen sind aufgrund der Diskretion, die bei der Auswahl und Zuordnung von dünn besetzten Schlüsselpunkten inhärent ist, schwierig in einem end-to-end-Verfahren zu lernen. Wir stellen DISK (DISkrete Schlüsselpunkte) vor, eine neuartige Methode, die diese Hürden durch die Anwendung von Prinzipien des Reinforcement Learnings (RL) überwindet und für ein hohes Maß an korrekten Merkmalszuordnungen end-to-end optimiert. Unser einfaches, aber ausdrucksstarkes stochastisches Modell ermöglicht es uns, die Trainings- und Inferenzphasen nahe beieinander zu halten, während es gleichzeitig ausreichend gute Konvergenzeigenschaften bietet, um zuverlässig von Grund auf zu trainieren. Unsere Merkmale können sehr dicht extrahiert werden und bleiben dennoch diskriminativ, was gängige Annahmen darüber, was einen guten Schlüsselpunkt ausmacht, in Frage stellt, wie Abbildung 1 zeigt. Sie liefern zudem Stand-of-the-Art-Ergebnisse in drei öffentlichen Benchmarks.