HyperAIHyperAI

Command Palette

Search for a command to run...

Constraints-Guided Diffusion Reasoner für neuro-symbolisches Lernen

Xuan Zhang Zhijian Zhou Weidi Xu Yanting Miao Chao Qu Yuan Qi

Zusammenfassung

Die Fähigkeit von neuronalen Netzen, komplexe logische Constraints zu lernen und symbolische Schlussfolgerungen zu ziehen, stellt eine zentrale Herausforderung dar. Der Brückenschlag zwischen neuronalen und symbolischen Ansätzen erfordert oft eine Steuerung der Ausgabeverteilung des neuronalen Netzes hin zu den vorgegebenen symbolischen Bedingungen. Während Diffusionsmodelle bemerkenswerte generative Fähigkeiten in verschiedenen Domänen gezeigt haben, nutzen wir diese leistungsfähige Architektur hier zur Durchführung neuro-symbolischer Lernprozesse und zur Lösung logischer Rätsel. Unser auf Diffusionsmodellen basierender Ansatz verfolgt eine zweistufige Trainingsstrategie: Im ersten Stadium wird die grundlegende Schlussfolgerungsfähigkeit entwickelt, während im zweiten Stadium das systematische Lernen logischer Constraints im Vordergrund steht. Um im zweiten Stadium starke (hard) Constraints auf die neuronalen Ausgaben aufzuerlegen, formulieren wir den Diffusions-Reasoner als ein Markov-Entscheidungsproblem und feinjustieren ihn innovativ mittels eines verbesserten Proximal-Policy-Optimierungsverfahrens (PPO). Wir nutzen eine regelbasierte Belohnungssignale, die aus der logischen Konsistenz der neuronalen Ausgaben abgeleitet wird, und setzen eine flexible Strategie zur Optimierung der Policy des Diffusions-Reasoners ein. Wir evaluieren unsere Methode an mehreren klassischen Benchmarks für symbolische Schlussfolgerung, darunter Sudoku, Labyrinthrätsel, Pfadfindung und Präferenzlernens. Experimentelle Ergebnisse zeigen, dass unser Ansatz herausragende Genauigkeit und logische Konsistenz bei neuronalen Netzwerken erreicht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp