مُفكِّك شجري للتحويل من الصورة إلى الترميز
تُستخدم النماذج الحديثة من نوع encoder-decoder عادةً مُفكّكات سلسلية (string decoders) لتحويل الصور إلى سلاسل مُرَتَّبة لتحويل الصور إلى علامة (markup). ومع ذلك، تواجه تمثيلات السلسلة صعوبات كبيرة في التعامل مع التعقيد الهيكلي عند استخدام تمثيلات شجرية للعلامات. في هذه الدراسة، نُظهر أولاً من خلال مجموعة من المشكلات التوضيحية (toy problems) أن المُفكّكات السلسلية تواجه صعوبة في فك تشفير الهياكل الشجرية، خاصةً مع زيادة التعقيد الهيكلي. ثم نُقدّم مُفكّكًا شجريًا مُصممًا خصيصًا لإنتاج علامات شجرية. يعمل هذا المُفكّك بشكل تسلسلي، حيث يتم في كل خطوة إنشاء عقدة فرعية وعُقدة والدة معًا لتكوين فرع شجري. ويُستخدم هذا الفرع لاحقًا لبناء الهيكل الشجري النهائي بطريقة متكررة. وتمثّل العوامل الأساسية لنجاح مُفكّكنا الشجري في جوانب متعددة: (أ) الالتزام الصارم بالعلاقة بين الوالد والطفل في الشجرة، و(ب) إخراج الشجرة بشكل صريح، بخلاف السلسلة الخطية. وعند تقييم الأداء على كل من التعرف على الصيغ الرياضية والتعرف على الصيغ الكيميائية، أظهر المُفكّك الشجري المقترح تفوقًا كبيرًا على النماذج القوية القائمة على المُفكّكات السلسلية.