HyperAIHyperAI

Command Palette

Search for a command to run...

vor 2 Monaten

Analyse der Denkketten-Dynamik: Aktive Steuerung oder untreue nachträgliche Rationalisierung?

Samuel Lewis-Lim Xingwei Tan Zhixue Zhao Nikolaos Aletras

Analyse der Denkketten-Dynamik: Aktive Steuerung oder untreue nachträgliche Rationalisierung?

Abstract

Neuere Arbeiten haben gezeigt, dass Chain-of-Thought (CoT) bei weichen Schlussfolgerungsaufgaben wie analytischer und alltäglicher (commonsense) Reasoning oft nur geringfügige Verbesserungen erzielt. Zudem kann CoT der tatsächlichen Schlussfolgerung eines Modells nicht immer treu bleiben. Wir untersuchen die Dynamik und Treue von CoT bei weichen Reasoning-Aufgaben anhand instruktionsangepasster, speziell auf Reasoning optimierter sowie durch Reasoning-Distillation verfeinerter Modelle. Unsere Ergebnisse zeigen, dass diese Modelle unterschiedlich stark auf CoT zurückgreifen, und belegen, dass die Wirkung von CoT und deren Treue nicht zwangsläufig zusammenfallen.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Analyse der Denkketten-Dynamik: Aktive Steuerung oder untreue nachträgliche Rationalisierung? | Forschungsarbeiten | HyperAI