HyperAIHyperAI
vor 11 Tagen

Die Rolle von Chain-of-Thought bei komplexen Vision-Sprache-Reasoning-Aufgaben

Yifan Wu, Pengchuan Zhang, Wenhan Xiong, Barlas Oguz, James C. Gee, Yixin Nie
Die Rolle von Chain-of-Thought bei komplexen Vision-Sprache-Reasoning-Aufgaben
Abstract

Die Studie untersucht die Wirksamkeit des Chain-of-Thought-Ansatzes, der sich durch seine Effizienz bei Sprachaufgaben auszeichnet, indem diese in Teilaufgaben und Zwischenschritte zerlegt werden, bei der Verbesserung von visuell-sprachlichen Aufgaben, die anspruchsvolle Wahrnehmung und Schlussfolgerung erfordern. Wir präsentieren die Strategie „Beschreibung zuerst, Entscheidung danach“, die sich von der Art und Weise inspirieren lässt, wie Menschen Signale verarbeiten. Diese Strategie steigert die Leistung bei Untersuchungsaufgaben signifikant um 50 % und legt somit die Grundlage für zukünftige Forschung zu Schlussfolgerungsparadigmen bei komplexen visuell-sprachlichen Aufgaben.

Die Rolle von Chain-of-Thought bei komplexen Vision-Sprache-Reasoning-Aufgaben | Neueste Forschungsarbeiten | HyperAI