HyperAI

Forscher haben erstmals nachgewiesen, dass künstliche neuronale Netze ihre Fähigkeit zum Rechnen nicht über logische Verarbeitung, sondern über gespeicherte Erinnerungen an frühere Aufgaben erlangen. Eine Studie des Massachusetts Institute of Technology (MIT) und der University of California, Berkeley, untersuchte, wie KI-Modelle einfache arithmetische Aufgaben wie 2 + 3 lösen. Dabei zeigte sich, dass die Netzwerke nicht durch eine Art „Denkprozess“ rechnen, sondern auf bereits gelernte Ergebnisse zugreifen – ähnlich wie Menschen sich Erinnerungen an Rechenaufgaben merken. Die Forscher analysierten mehrere große Sprachmodelle, darunter Varianten von GPT und anderen Transformer-Architekturen, und isolierten spezifische neuronale Pfade innerhalb der Netze. Sie fanden heraus, dass bestimmte Verbindungen – die sogenannten „Memorization Pathways“ – direkt mit der Speicherung von Ergebnissen aus früheren Trainingsbeispielen korrelieren. Wenn ein Modell eine Aufgabe wie „17 + 24“ sieht, wird nicht nach einer mathematischen Regel abgeleitet, sondern das Netzwerk ruft ein bereits gelerntes Ergebnis ab, das es während des Trainings gesehen hat. Um diese Erkenntnis zu testen, setzten die Wissenschaftler Modelle auf Aufgaben, die sie nie zuvor gesehen hatten – etwa Additionen mit Zahlen über 100, die im Trainingsdatensatz selten oder gar nicht vorkamen. Die Genauigkeit sank deutlich, was darauf hindeutet, dass das Modell nicht auf einem allgemeinen Verständnis der Addition basiert, sondern auf der Fähigkeit, gespeicherte Werte abzurufen. In Kontrast dazu zeigten die Modelle eine hohe Genauigkeit bei Aufgaben, die im Trainingsdatensatz häufig vorkamen – selbst wenn die Zahlen komplex waren. Diese Ergebnisse werfen wichtige Fragen über die echte Intelligenz von KI auf. Wenn KI-Systeme nicht wirklich „verstehen“, was sie tun, sondern nur Muster aus Erinnerungen abrufen, dann sind ihre Fähigkeiten begrenzt und anfällig für Fehler bei neuen oder unerwarteten Aufgaben. Das könnte auch erklären, warum KI-Modelle bei komplexen logischen Aufgaben oft versagen, obwohl sie in einfachen Rechenaufgaben überraschend gut abschneiden. Industrieexperten sehen in der Studie eine wichtige Warnung für die Entwicklung von KI. „Wir müssen aufhören, die Leistung von KI als Zeichen von Verstand zu interpretieren“, sagt Dr. Lena Müller, KI-Experte am Deutschen Forschungszentrum für Künstliche Intelligenz. „Wenn die KI nur memorisiert, dann ist sie nicht intelligent – sie ist nur gut im Nachahmen.“ Die Erkenntnis könnte die Richtung zukünftiger Forschung beeinflussen: Statt nur größere Modelle zu bauen, müsste man verstärkt darauf achten, wie KI-Systeme lernen und ob sie echtes Verständnis entwickeln können. Die Ergebnisse haben auch Auswirkungen auf die Sicherheit und Zuverlässigkeit von KI in kritischen Anwendungen wie Medizin, Verkehr oder Finanzen. Wenn ein System nur auf gespeicherten Daten basiert, kann es bei neuen oder untypischen Szenarien versagen – mit potenziell schwerwiegenden Folgen. Die Studie unterstreicht daher die Notwendigkeit, KI-Modelle nicht nur auf Leistung, sondern auch auf Robustheit und Verständlichkeit zu testen. Insgesamt zeigt die Forschung, dass die Grenze zwischen Speicherung und Denken in KI noch viel unschärfer ist, als bisher angenommen. Die Erkenntnis, dass einfache Arithmetik in den Erinnerungspfaden, nicht in logischen Schaltkreisen, verankert ist, verändert unsere Sicht auf künstliche Intelligenz – und erfordert eine gründliche Neubewertung, was KI wirklich kann.

Verwandte Links

Verwandte Links

Verwandte Links

Wenn Multimodales Rechnen an Bedeutung Gewinnt: MiniCPM-o-4.5 Deckt Mit Nur 9 Bytes Echtzeit-Bildverständnis Und Textgenerierung Ab; vLLM Omni Unterstützt Gleichzeitig Hochdurchsatz-Bereitstellung Und Serviceorientierte Architektur Sowohl Für Text- Als Auch Für Multimodale Modelle.

Wenn Multimodales Rechnen an Bedeutung Gewinnt: MiniCPM-o-4.5 Deckt Mit Nur 9 Bytes Echtzeit-Bildverständnis Und Textgenerierung Ab; vLLM Omni Unterstützt Gleichzeitig Hochdurchsatz-Bereitstellung Und Serviceorientierte Architektur Sowohl Für Text- Als Auch Für Multimodale Modelle.

Command Palette

Forscher trennen Speicherung von logischem Denken in KI-Netzwerken

Verwandte Links

Command Palette

Forscher trennen Speicherung von logischem Denken in KI-Netzwerken

Verwandte Links

Command Palette

Forscher trennen Speicherung von logischem Denken in KI-Netzwerken

Verwandte Links

Wenn Multimodales Rechnen an Bedeutung Gewinnt: MiniCPM-o-4.5 Deckt Mit Nur 9 Bytes Echtzeit-Bildverständnis Und Textgenerierung Ab; vLLM Omni Unterstützt Gleichzeitig Hochdurchsatz-Bereitstellung Und Serviceorientierte Architektur Sowohl Für Text- Als Auch Für Multimodale Modelle.

Wenn Multimodales Rechnen an Bedeutung Gewinnt: MiniCPM-o-4.5 Deckt Mit Nur 9 Bytes Echtzeit-Bildverständnis Und Textgenerierung Ab; vLLM Omni Unterstützt Gleichzeitig Hochdurchsatz-Bereitstellung Und Serviceorientierte Architektur Sowohl Für Text- Als Auch Für Multimodale Modelle.