HyperAIHyperAI
vor 17 Tagen

Support-Set-Kontext ist für Bongard-Probleme von Bedeutung

Nikhil Raghuraman, Adam W. Harley, Leonidas Guibas
Support-Set-Kontext ist für Bongard-Probleme von Bedeutung
Abstract

Aktuelle Methoden des maschinellen Lernens stoßen bei der Lösung von Bongard-Aufgaben an ihre Grenzen, die eine Art Intelligenztest darstellen und die Ableitung eines abstrakten „Konzepts“ aus einer Menge positiver und negativer „Support-Bilder“ erfordern, gefolgt von der Klassifizierung, ob ein neues Query-Bild das zentrale Konzept darstellt. Auf Bongard-HOI, einem Benchmark für natürliche Bilder im Kontext von Bongard-Aufgaben, erreichen die meisten bestehenden Ansätze maximal eine Genauigkeit von 69 % (zufällige Wahl liegt bei 50 %). Eine geringe Genauigkeit wird oft auf die Unfähigkeit von neuronalen Netzen zurückgeführt, menschenähnliche symbolische Regeln zu erkennen. In dieser Arbeit weisen wir darauf hin, dass viele bestehende Methoden aufgrund eines viel einfacheren Problems ihre Genauigkeit verlieren: Sie passen die Bilddatenmerkmale nicht an, basierend auf der Gesamtheit der Informationen im Support-Satz, sondern verlassen sich stattdessen ausschließlich auf Informationen, die aus einzelnen Support-Bildern extrahiert wurden. Dies stellt ein entscheidendes Problem dar, da das „zentrale Konzept“ in einer typischen Bongard-Aufgabe oft nur durch die Kombination mehrerer positiver und mehrerer negativer Beispiele unterscheidbar ist. Wir untersuchen einfache Ansätze, um diesen Kontext einzubeziehen, und zeigen erhebliche Verbesserungen gegenüber früheren Arbeiten, was zu neuen SOTA-Ergebnissen auf Bongard-LOGO (75,3 %) und Bongard-HOI (76,4 %) führt – im Vergleich zu Methoden mit identischen Vision-Backbone-Architekturen und starkem Leistungsvermögen auf dem ursprünglichen Bongard-Aufgaben-Satz (60,8 %).