HyperAIHyperAI
منذ 2 أشهر

Recipe1M+: مجموعة بيانات لتعلم التضمينات متعددة الوسائط للوصفات الطهي وصور الطعام

Javier Marin; Aritro Biswas; Ferda Ofli; Nicholas Hynes; Amaia Salvador; Yusuf Aytar; Ingmar Weber; Antonio Torralba
Recipe1M+: مجموعة بيانات لتعلم التضمينات متعددة الوسائط للوصفات الطهي وصور الطعام
الملخص

في هذا البحث، نقدم Recipe1M+، وهو مجمع بيانات كبير ومُنظَّم يحتوي على أكثر من مليون وصفة طهي و13 مليون صورة لطعام. كأكبر مجموعة بيانات متاحة للعامة في مجال الوصفات، يوفر Recipe1M+ القدرة على تدريب نماذج ذات قدرة عالية على البيانات المتعددة الأوضاع والمُحاذَّة. باستخدام هذه البيانات، نقوم بتدريب شبكة عصبية لتعلم تمثيل مشترك للوصفات والصور يحقق نتائج ملحوظة في مهمة استرجاع الصور والوصفات. بالإضافة إلى ذلك، نوضح أن التسوية من خلال إضافة هدف تصنيف رفيع المستوى تحسن أداء الاسترجاع حتى تضاهي أداء البشر وتتيح الحسابات المتجهية الدلالية. نفترض أن هذه التمثيلات ستوفِّر أساسًا لمزيد من استكشاف مجموعة بيانات Recipe1M+ والطعام والطهي بشكل عام. الرمز البرمجي والبيانات والنماذج متاحة للعامة.

Recipe1M+: مجموعة بيانات لتعلم التضمينات متعددة الوسائط للوصفات الطهي وصور الطعام | أحدث الأوراق البحثية | HyperAI