ICAL: Implizites zeichenbasiertes Lernen zur verbesserten Erkennung von handschriftlichen mathematischen Ausdrücken

Wichtige Fortschritte wurden im Bereich der Erkennung handschriftlicher mathematischer Ausdrücke erzielt, während bestehende Encoder-Decoder-Methoden es in der Regel schwierig finden, globale Informationen in $LaTeX$ zu modellieren. Daher stellt dieser Artikel einen neuen Ansatz, das implizite zeichenbasierte Lernen (ICAL – Implicit Character-Aided Learning), vor, um globale Ausdrucksinformationen zu extrahieren und die Erkennung handschriftlicher mathematischer Ausdrücke zu verbessern. Insbesondere schlagen wir das Modul zur impliziten Zeichenerstellung (ICCM – Implicit Character Construction Module) vor, um implizite Zeichenfolgen vorherzusagen, und verwenden ein Fusionsmodul, um die Ausgaben des ICCM und des Decoders zu vereinen, wodurch korrigierte Vorhersagen erzeugt werden. Durch das Modellieren und Nutzen von impliziter Zeicheninformation erreicht ICAL eine genauere und kontextbewusste Interpretation handschriftlicher mathematischer Ausdrücke. Experimentelle Ergebnisse zeigen, dass ICAL die besten bisher bekannten (SOTA – State-of-the-Art) Modelle deutlich übertrifft und die Erkennungsrate (ExpRate) auf den Datensätzen CROHME 2014/2016/2019 jeweils um 2,25%/1,81%/1,39% verbessert sowie eine bemerkenswerte Rate von 69,06% auf dem anspruchsvollen HME100k-Testset erreicht. Unser Code ist auf GitHub verfügbar: https://github.com/qingzhenduyu/ICAL