ChatGPT als Datenverstärkung für compositionale Verallgemeinerung: Eine Fallstudie zur Offenen Absichtserkennung

Die Erkennung offener Intentionen, ein entscheidendes Element der natürlichen Sprachverarbeitung, beinhaltet die Identifizierung zuvor unbekannter Intentionen in nutzergenerierten Texten. Trotz der Fortschritte in diesem Bereich bestehen weiterhin Herausforderungen bei der Verarbeitung neuer Kombinationen von Sprachkomponenten, was für die compositionsale Generalisierung essentiell ist. In dieser Arbeit präsentieren wir eine Fallstudie, die den Einsatz von ChatGPT als Datenverstärkungstechnik zur Verbesserung der compositionsalen Generalisierung in Aufgaben zur Erkennung offener Intentionen untersucht. Wir beginnen mit einer Diskussion der Einschränkungen bestehender Benchmarks bei der Bewertung dieses Problems und betonen die Notwendigkeit, Datensätze zu erstellen, um compositionsale Generalisierung in Aufgaben zur Erkennung offener Intentionen anzugehen. Durch die Integration synthetischer Daten, die von ChatGPT generiert wurden, in den Trainingsprozess zeigen wir, dass unser Ansatz die Modellleistung effektiv verbessern kann. Eine sorgfältige Evaluierung mehrerer Benchmarks ergibt, dass unsere Methode bestehende Techniken übertrifft und die Fähigkeiten zur Erkennung offener Intentionen erheblich steigert. Unsere Ergebnisse unterstreichen das Potenzial großer Sprachmodelle wie ChatGPT für die Datenverstärkung in Aufgaben der natürlichen Sprachverarbeitung.