HyperAIHyperAI

Command Palette

Search for a command to run...

الاسترجاع الغذائي عبر الوسائط: تعلّم تمثيل مشترك للصور الغذائية والوصفات مع الاتساق الدلالي وآلية الانتباه

Hao Wang Doyen Sahoo Chenghao Liu Ke Shu Palakorn Achananuparp Ee-peng Lim Steven C. H. Hoi

الملخص

استرجاع الطعام هو مهمة مهمة لتحليل المعلومات المتعلقة بالطعام، حيث نهتم باسترجاع المعلومات ذات الصلة بالمنتج الغذائي المطلوب، مثل المكونات، وإرشادات الطهي، إلخ. في هذه الورقة، نستعرض استرجاعًا متعدد الأوجه بين صور الطعام ووصفات الطهي. الهدف هو تعلم تمثيل لصور الطعام ووصفات الطهي في فضاء ميزة مشترك، بحيث تقع تمثيلات الصور والوصفات المقابلة بالقرب من بعضها البعض. هناك تحديان رئيسيان في معالجة هذه المشكلة: الأول هو التباين الكبير داخليًا والتمايز الصغير بين الأنواع في بيانات الطعام متعددة الأوجه؛ والثاني هو صعوبة الحصول على تمثيلات وصفات تمييزية. لحل هذين التحديين، نقترح شبكة ذات اتساق دلالي وآليات انتباه (SCAN)، التي تُنظم تمثيلات الكائنين من خلال محاذاة احتمالات المعاني الناتجة. علاوةً على ذلك، نستفيد من آلية انتباه ذاتي لتحسين تمثيل وصفات الطهي. وقد قُمنا بتقييم أداء الطريقة المقترحة على مجموعة بيانات وصفات كبيرة الحجم Recipe1M، وأظهرنا أننا نتفوق بفارق كبير على عدة استراتيجيات حديثة متقدمة لاسترجاع متعدد الأوجه في صور الطعام ووصفات الطهي.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
الاسترجاع الغذائي عبر الوسائط: تعلّم تمثيل مشترك للصور الغذائية والوصفات مع الاتساق الدلالي وآلية الانتباه | مستندات | HyperAI