ICAL: التعلم الضمني المُساعَد بالحروف لتحسين التعرف على التعبيرات الرياضية المكتوبة بخط اليد

تم إحراز تقدم كبير في مجال التعرف على التعبيرات الرياضية المكتوبة بخط اليد، ومع ذلك فإن طرق الترميز-التفكيز الحالية غالبًا ما تكون صعبة في نمذجة المعلومات العالمية في لاتك ($LaTeX$). لذلك، يُقدّم هذا البحث منهجًا جديدًا، وهو التعلم المعزّز بالحروف الضمنية (ICAL)، لاستخراج معلومات التعبير العالمي وتعزيز التعرف على التعبيرات الرياضية المكتوبة بخط اليد. بشكل خاص، نقترح وحدة بناء الحروف الضمنية (ICCM) للتنبؤ بالسلاسل الحرفية الضمنية واستخدام وحدة دمج لدمج مخرجات ICCM والتفكيز، مما يؤدي إلى إنتاج توقعات مصححة. من خلال نمذجة واستخدام معلومات الحروف الضمنية، يحقق ICAL تفسيرًا أكثر دقة وإدراكًا للسياق للتعبيرات الرياضية المكتوبة بخط اليد. تظهر النتائج التجريبية أن ICAL يتفوق بشكل ملحوظ على أفضل النماذج الحالية (SOTA)، حيث يحسن معدل التعرف على التعبيرات (ExpRate) بنسبة 2.25\%/1.81\%/1.39\% على مجموعات بيانات CROHME 2014/2016/2019 على التوالي، ويحقق نسبة ملحوظة تبلغ 69.06\% على مجموعة اختبار HME100k الصعبة. نحن نوفر كودنا على موقع GitHub:https://github.com/qingzhenduyu/ICAL