HyperAIHyperAI

Command Palette

Search for a command to run...

DocBERT: BERT für Dokumentenklassifizierung

Ashutosh Adhikari Achyudh Ram Raphael Tang Jimmy Lin

Zusammenfassung

Wir präsentieren, soweit wir wissen, die erste Anwendung von BERT auf die Dokumentenklassifizierung. Einige Merkmale der Aufgabe könnten dazu führen, dass man annimmt, BERT sei nicht das geeignetste Modell: Syntaxstrukturen sind für Inhaltskategorien weniger wichtig, Dokumente können häufig länger sein als typische BERT-Eingaben und Dokumente haben oft mehrere Labels. Trotzdem zeigen wir, dass ein einfaches Klassifikationsmodell mit BERT den aktuellen Stand der Technik in vier gängigen Datensätzen erreichen kann. Um die mit der Inferenz von BERT verbundenen Rechenkosten zu reduzieren, transferieren wir Wissen vom BERT-Large-Modell zu kleinen bidirektionalen LSTMs (Long Short-Term Memory), wodurch wir bei mehreren Datensätzen eine Leistung erreichen, die mit dem BERT-Base-Modell vergleichbar ist, aber mit 30-mal weniger Parametern. Der Hauptbeitrag unseres Artikels besteht in verbesserten Baselines, die als Grundlage für zukünftige Arbeiten dienen können.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp