vor 2 Monaten

Analyse der Denkketten-Dynamik: Aktive Steuerung oder untreue nachträgliche Rationalisierung?

Samuel Lewis-Lim Xingwei Tan Zhixue Zhao Nikolaos Aletras

Abstract

Neuere Arbeiten haben gezeigt, dass Chain-of-Thought (CoT) bei weichen Schlussfolgerungsaufgaben wie analytischer und alltäglicher (commonsense) Reasoning oft nur geringfügige Verbesserungen erzielt. Zudem kann CoT der tatsächlichen Schlussfolgerung eines Modells nicht immer treu bleiben. Wir untersuchen die Dynamik und Treue von CoT bei weichen Reasoning-Aufgaben anhand instruktionsangepasster, speziell auf Reasoning optimierter sowie durch Reasoning-Distillation verfeinerter Modelle. Unsere Ergebnisse zeigen, dass diese Modelle unterschiedlich stark auf CoT zurückgreifen, und belegen, dass die Wirkung von CoT und deren Treue nicht zwangsläufig zusammenfallen.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding

Sofort einsatzbereit GPUs

Beste Preise

Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Analyse der Denkketten-Dynamik: Aktive Steuerung oder untreue nachträgliche Rationalisierung?

Samuel Lewis-Lim Xingwei Tan Zhixue Zhao Nikolaos Aletras

Abstract

KI mit KI entwickeln

Hyper Newsletters