PHYRE: Eine Neue Benchmark für Physikalisches Denken

Das Verständnis und die Schlussfolgerung aus physikalischen Prinzipien ist eine wichtige Fähigkeit intelligenter Agenten. Wir entwickeln den PHYRE-Benchmark für physikalisches Denken, der eine Reihe einfacher klassischer Mechanikaufgaben in einer zweidimensionalen physikalischen Umgebung enthält. Der Benchmark ist so konzipiert, dass er die Entwicklung von Lernalgorithmen fördert, die effizient mit wenigen Beispielen arbeiten und sich gut auf verschiedene Aufgaben übertragen lassen. Wir testen mehrere moderne Lernalgorithmen anhand des PHYRE-Benchmarks und stellen fest, dass diese Algorithmen bei der effizienten Lösung der Aufgaben noch Schwierigkeiten haben. Wir erwarten, dass PHYRE zur Entwicklung neuer, beispiel-effizienter Agenten beiträgt, die nützliche und effiziente Modelle der Physik erlernen können. Für den Code und um PHYRE selbst ausprobieren zu können, besuchen Sie bitte https://player.phyre.ai.