HyperAIHyperAI
vor 2 Monaten

Die Analyse der mathematischen Denkfähigkeiten neuronaler Modelle

David Saxton; Edward Grefenstette; Felix Hill; Pushmeet Kohli
Die Analyse der mathematischen Denkfähigkeiten neuronaler Modelle
Abstract

Mathematisches Denken – eine zentrale Fähigkeit innerhalb der menschlichen Intelligenz – stellt als Domäne einige einzigartige Herausforderungen dar: Wir kommen nicht primär durch Erfahrung und Beweise zu einem Verständnis und zur Lösung mathematischer Probleme, sondern auf der Grundlage von Schlussfolgerungen, Lernen und Nutzung von Gesetzen, Axiomen und Regeln für die Manipulation von Symbolen. In dieser Arbeit stellen wir eine neue Herausforderung für die Bewertung (und letztendlich den Entwurf) neuronaler Architekturen und ähnlicher Systeme vor, indem wir eine Aufgabensammlung mathematischer Probleme entwickeln, die sequenzielle Fragen und Antworten in einem freien textbasierten Eingabe-/Ausgabeformat umfasst. Die strukturierte Natur des Mathematikbereichs, der Arithmetik, Algebra, Wahrscheinlichkeitstheorie und Analysis abdeckt, ermöglicht die Konstruktion von Trainings- und Testaufteilungen, die dazu geeignet sind, die Fähigkeiten und Schwachstellen verschiedener Architekturen klar zu beleuchten sowie deren Fähigkeit zu bewerten, Wissen zu komponieren und gelernte Prozesse miteinander in Beziehung zu setzen. Nach einer Beschreibung des Datenerzeugungsprozesses und seiner potentiellen zukünftigen Erweiterungen führen wir eine umfassende Analyse von Modellen aus zwei großen Klassen der leistungsfähigsten Sequenz-zu-Sequenz-Architekturen durch und finden bemerkenswerte Unterschiede in ihrer Fähigkeit, mathematische Probleme zu lösen und ihr Wissen zu generalisieren.