HyperAIHyperAI

Command Palette

Search for a command to run...

LLaVA-Chef: نموذج تولي متعدد الأوضاع لوصفات الطعام

Fnu Mohbat Mohammed J. Zaki

الملخص

في المناظر السريعة التطور لمشاركة الوصفات عبر الإنترنت في سياق عالمي، شهدت الأبحاث زيادة ملحوظة نحو فهم وإنشاء وصفات الطعام. وقد مهدت التقدمات الحديثة في نماذج اللغة الكبيرة (LLMs) مثل GPT-2 وLLaVA الطريق لأساليب معالجة اللغة الطبيعية (NLP) للغوص بشكل أعمق في جوانب مختلفة للمهام المتعلقة بالطعام، بما في ذلك تحديد المكونات وإنشاء الوصفات الشاملة. على الرغم من الأداء المثير للإعجاب والتكيف متعدد الأوضاع لنماذج اللغة الكبيرة (LLMs)، إلا أن التدريب الخاص بالمنطقة ما زال ضروريًا لتحقيق تطبيقات فعالة. يقيم هذا البحث النماذج الحالية من LLMs لإنشاء الوصفات ويقترح LLaVA-Chef، وهو نموذج جديد تم تدريبه على مجموعة بيانات مختارة تحتوي على دعوات وصفات متنوعة باستخدام نهج متعدد المراحل. أولاً، نقوم بتحسين ربط تضمين الصور الغذائية البصرية بفضاء اللغة. ثانياً، نتكيف LLaVA مع مجال الطعام عن طريق تعديلها على بيانات الوصفات ذات الصلة. ثالثاً، نستفيد من الدعوات المتنوعة لتعزيز فهم النموذج للوصفات. وأخيراً، نحسن جودة اللغة في الوصفات المنشأة عن طريق معاقبة النموذج باستخدام دالة خسارة مخصصة. يظهر LLaVA-Chef تحسينات كبيرة مقارنة بنماذج LLMs المسبقة والأعمال السابقة. وكشفت التحليل النوعي التفصيلي أن LLaVA-Chef يولد وصفات أكثر تفصيلاً مع ذكر دقيق للمكونات مقارنة بالأساليب الموجودة حاليًا.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
LLaVA-Chef: نموذج تولي متعدد الأوضاع لوصفات الطعام | مستندات | HyperAI