Lesen, Hören und Sehen: Die Nutzung multimodaler Informationen fördert die Rechtschreibprüfung im Chinesischen

Die chinesische Rechtschreibprüfung (CSC) hat das Ziel, fehlerhafte Zeichen in von Nutzern generierten Texten der chinesischen Sprache zu erkennen und zu korrigieren. Die meisten chinesischen Rechtschreibfehler sind semantisch, phonetisch oder graphisch ähnliche Zeichen, die falsch verwendet werden. Frühere Versuche haben dieses Phänomen bemerkt und versucht, die Ähnlichkeit für diese Aufgabe zu nutzen. Diese Methoden verwenden jedoch entweder Heuristiken oder manuell erstellte Verwechslungsmengen, um das korrekte Zeichen vorherzusagen. In dieser Arbeit schlagen wir einen chinesischen Rechtschreibprüfer namens ReaLiSe vor, der die multimodale Information der chinesischen Zeichen direkt nutzt. Das Modell ReaLiSe löst die CSC-Aufgabe durch (1) das Erfassen der semantischen, phonetischen und graphischen Informationen der Eingabezeichen und (2) das selektive Mischen dieser Informationen in den Modalitäten zur Vorhersage des korrekten Ausgabeszeichens. Experimente anhand der SIGHAN-Benchmarks zeigen, dass das vorgeschlagene Modell starken Baselines bei weitem überlegen ist.