HyperAIHyperAI

Command Palette

Search for a command to run...

مُفكِّك شجري للتحويل من الصورة إلى الترميز

Li-Rong Dai Yi-Zhe Song Yongxin Yang Si Wei Jun Du Jianshu Zhang

الملخص

تُستخدم النماذج الحديثة من نوع encoder-decoder عادةً مُفكّكات سلسلية (string decoders) لتحويل الصور إلى سلاسل مُرَتَّبة لتحويل الصور إلى علامة (markup). ومع ذلك، تواجه تمثيلات السلسلة صعوبات كبيرة في التعامل مع التعقيد الهيكلي عند استخدام تمثيلات شجرية للعلامات. في هذه الدراسة، نُظهر أولاً من خلال مجموعة من المشكلات التوضيحية (toy problems) أن المُفكّكات السلسلية تواجه صعوبة في فك تشفير الهياكل الشجرية، خاصةً مع زيادة التعقيد الهيكلي. ثم نُقدّم مُفكّكًا شجريًا مُصممًا خصيصًا لإنتاج علامات شجرية. يعمل هذا المُفكّك بشكل تسلسلي، حيث يتم في كل خطوة إنشاء عقدة فرعية وعُقدة والدة معًا لتكوين فرع شجري. ويُستخدم هذا الفرع لاحقًا لبناء الهيكل الشجري النهائي بطريقة متكررة. وتمثّل العوامل الأساسية لنجاح مُفكّكنا الشجري في جوانب متعددة: (أ) الالتزام الصارم بالعلاقة بين الوالد والطفل في الشجرة، و(ب) إخراج الشجرة بشكل صريح، بخلاف السلسلة الخطية. وعند تقييم الأداء على كل من التعرف على الصيغ الرياضية والتعرف على الصيغ الكيميائية، أظهر المُفكّك الشجري المقترح تفوقًا كبيرًا على النماذج القوية القائمة على المُفكّكات السلسلية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp