
要約
手書き数式認識の分野で著しい進歩が見られましたが、既存のエンコーダー-デコーダーメソッドは通常、$LaTeX$における全体的な情報をモデル化することが困難です。そこで本論文では、新たな手法であるImplicit Character-Aided Learning(ICAL)を提案し、全体的な数式情報の抽出と手書き数式認識の向上を図ります。具体的には、Implicit Character Construction Module(ICCM)を提案して暗黙の文字列を予測し、Fusion Moduleを使用してICCMとデコーダーの出力を統合することで、修正された予測を生成します。暗黙の文字情報のモデリングと利用により、ICALはより正確で文脈に応じた手書き数式の解釈を実現しています。実験結果は、ICALが最先端(SOTA)モデルを大幅に上回ることを示しており、CROHME 2014/2016/2019データセットにおいてそれぞれ2.25%/1.81%/1.39%の表現認識率(ExpRate)向上を達成しています。さらに、難易度が高いHME100kテストセットにおいても69.06%という優れた成績を収めています。我々はコードをGitHub上で公開しています: https://github.com/qingzhenduyu/ICAL