HyperAIHyperAI

Command Palette

Search for a command to run...

TweetEval: Einheitlicher Benchmark und vergleichende Bewertung für die Tweet-Klassifizierung

Francesco Barbieri Jose Camacho-Collados Leonardo Neves Luis Espinosa-Anke

Zusammenfassung

Das experimentelle Landschaft in der Verarbeitung natürlicher Sprache für soziale Medien ist zu fragmentiert. Jedes Jahr werden neue gemeinsame Aufgaben und Datensätze vorgeschlagen, die von Klassikern wie der Sentimentanalyse über die Erkennung von Ironie bis hin zur Vorhersage von Emoji reichen. Daher ist unklar, welcher derzeitige Stand der Technik vorliegt, da weder ein standardisierter Evaluationsprotokoll noch eine starke Baseline-Menge existiert, die auf solchen domain-spezifischen Daten trainiert wurde. In diesem Paper stellen wir einen neuen Evaluationsrahmen (TweetEval) vor, der aus sieben heterogenen, Twitter-spezifischen Klassifikationsaufgaben besteht. Zudem bieten wir eine starke Baseline-Menge als Ausgangspunkt an und vergleichen verschiedene Strategien für die Vortrainierung sprachlicher Modelle. Unsere ersten Experimente zeigen die Wirksamkeit, mit bereits existierenden, generischen vortrainierten Sprachmodellen zu beginnen und diese anschließend weiter auf Twitter-Korpora zu trainieren.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp