HyperAIHyperAI

Command Palette

Search for a command to run...

Tiefe Diakritisierung: Effiziente hierarchische Rekurrenz zur verbesserten arabischen Diakritisierung

Badr AlKhamissi Muhammad N. ElNokrashy Mohamed Gabr

Zusammenfassung

Wir schlagen eine neuartige Architektur zur Klassifizierung von Zeichenfolgen vor, die auf dem Tashkeela-Arabischen Diakritik-Benchmark erstklassige Ergebnisse erzielt. Der Kern dieser Architektur besteht in einer zweistufigen Rekurrenz-Hierarchie, die getrennt auf Wort- und Zeichenebene operiert – was schnelleres Training und Inferenz im Vergleich zu traditionellen Modellen ermöglicht. Ein cross-level Attention-Modul verbindet diese beiden Ebenen weiter und bietet Möglichkeiten für die Interpretierbarkeit des Netzes. Das Aufgabenmodul ist ein Softmax-Klassifikator, der gültige Kombinationen von Diakritika auflistet. Diese Architektur kann durch einen rekurrenten Decoder erweitert werden, der optional Vorwissen aus teilweise diakritisierten Texten akzeptiert, was die Ergebnisse verbessert. Zusätzlich verwenden wir Techniken wie Satzdropout und Mehrheitsvoting, um das endgültige Ergebnis weiter zu optimieren. Unser bestes Modell erreicht einen WER von 5,34 % und übertreffen das bisherige Erstklasse-Level um 30,56 % relativen Fehlerreduktion.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp