Sind ChatGPT und GPT-4 allgemein einsetzbare Lösungsmethoden für die Finanztextanalyse? Eine Studie zu mehreren typischen Aufgaben

Die jüngsten großen Sprachmodelle (LLMs), wie beispielsweise ChatGPT und GPT-4, haben bemerkenswerte Fähigkeiten allgemeiner Modelle gezeigt und erreichen mit geringer oder keiner Anpassung state-of-the-art-Leistungen bei einer Vielzahl von NLP-Aufgaben. Wie effektiv sind solche Modelle im Finanzbereich? Die Beantwortung dieser grundlegenden Frage hätte erhebliche Auswirkungen auf zahlreiche nachgelagerte finanzanalytische Aufgaben. In diesem Paper führen wir eine empirische Studie durch und liefern experimentelle Belege für ihre Leistungsfähigkeit bei einer breiten Palette von Aufgaben der Finanztextanalyse, wobei wir acht Benchmark-Datensätze aus fünf Kategorien von Aufgaben verwenden. Wir analysieren sowohl die Stärken als auch die Grenzen der aktuellen Modelle, indem wir sie mit state-of-the-art fine-tunenden Ansätzen und kürzlich veröffentlichten domain-spezifischen vortrainierten Modellen vergleichen. Wir hoffen, dass unsere Studie dazu beitragen kann, das Leistungspotenzial bestehender Modelle im Finanzbereich besser zu verstehen und weitere Verbesserungen zu fördern.