Siamese-Neural-Netzwerke für die One-Shot-Bilderkennung

Der Prozess der Lernung guter Merkmale für Anwendungen im Bereich des maschinellen Lernens kann sehr rechenintensiv sein und erweist sich als besonders herausfordernd in Fällen, in denen nur geringe Datenmengen zur Verfügung stehen. Ein prototypisches Beispiel hierfür ist die One-Shot-Lern-Situation, bei der wir präzise Vorhersagen treffen müssen, basierend lediglich auf einem einzigen Beispiel pro neue Klasse. In diesem Artikel untersuchen wir eine Methode zum Lernen von Siamese-Neural-Netzwerken, die eine spezifische Architektur nutzen, um die Ähnlichkeit zwischen Eingabedaten natürlicherweise zu ranken. Sobald ein solches Netzwerk kalibriert wurde, können wir mithilfe der starken diskriminativen Merkmale die Vorhersagekraft des Netzwerks nicht nur auf neue Daten, sondern auch auf völlig neue Klassen aus unbekannten Verteilungen verallgemeinern. Unter Verwendung einer konvolutionellen Architektur erreichen wir Ergebnisse, die die Leistung anderer tiefen Lernmodelle übertreffen und nahezu state-of-the-art-Leistung bei One-Shot-Klassifizierungsaufgaben erzielen.