HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

Multitask Semi-Supervised Learning für klassenunbalancierte Diskurs-Klassifikation

{Lingjia Deng Sz-Rung Shiang Jonathan May Alexander Spangher}

Multitask Semi-Supervised Learning für klassenunbalancierte Diskurs-Klassifikation

Abstract

Mit der Entwicklung von Labeling-Schemata im Laufe der Zeit können kleinste Unterschiede dazu führen, dass Datensätze, die auf älteren Schemata basieren, nicht mehr verwendbar sind. Dies erschwert es Forschern, auf vorherige Annotationen aufzubauen und führt insbesondere im Bereich des Diskurslernens zu einer Vielzahl kleiner, klassenungleicher Datensätze. In dieser Arbeit zeigen wir, dass ein Multitask-Lernansatz es ermöglicht, Diskursdatensätze aus ähnlichen und unterschiedlichen Domänen zu kombinieren, um die Diskursklassifikation zu verbessern. Wir erreichen eine Steigerung des Micro F1-Scores um 4,9 % gegenüber aktuellen State-of-the-Art-Benchmarks auf dem NewsDiscourse-Datensatz, einem der größten kürzlich veröffentlichten Diskursdatensätze. Dieser Fortschritt beruht teilweise auf den Labelkorrelationen zwischen Aufgaben, die die Leistung für unterrepräsentierte Klassen verbessern. Zudem präsentieren wir eine umfassende Übersicht über zusätzliche Techniken, die zur Bewältigung ressourcenarmer Probleme im Bereich der NLP vorgeschlagen wurden, und zeigen, dass in unserer Anwendung keine dieser Ansätze die Klassifikationsgenauigkeit steigern kann.

Benchmarks

BenchmarkMethodikMetriken
text-classification-on-newsdiscourseMT-Mac (Spangher et al., 2021)
macro F1: 63.46
text-classification-on-newsdiscourseMT-Mic (Spangher et al., 2021)
macro F1: 61.89
text-classification-on-newsdiscourseHuman (Post-Rec.) (Spangher et al., 2021)
macro F1: 73.69
text-classification-on-newsdiscourseHuman (Blind) (Spangher et al., 2021)
macro F1: 46.18

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp