منذ 11 أيام
OpenFlamingo: إطار مفتوح المصدر لتدريب النماذج الكبيرة التوليدية متعددة الوسائط البصرية واللغوية
Anas Awadalla, Irena Gao, Josh Gardner, Jack Hessel, Yusuf Hanafy, Wanrong Zhu, Kalyani Marathe, Yonatan Bitton, Samir Gadre, Shiori Sagawa, Jenia Jitsev, Simon Kornblith, Pang Wei Koh, Gabriel Ilharco, Mitchell Wortsman, Ludwig Schmidt

الملخص
نقدّم OpenFlamingo، وهي عائلة من نماذج الرؤية واللغة ذات التوليد التسلسلي التي تتراوح حجمها بين 3B و9B معلمة. يُعدّ OpenFlamingo جهدًا جارِيًا لإنتاج نسخة مفتوحة المصدر للنماذج التي طوّرها DeepMind تحت اسم Flamingo. على سبعة مجموعات بيانات للرؤية واللغة، تحقق نماذج OpenFlamingo متوسط أداء يتراوح بين 80% و89% من أداء النماذج المقابلة من نوع Flamingo. يُقدّم هذا التقرير التقني وصفًا لنماذجنا، وبيانات التدريب، والمقاييس الفائقة، ونُظم التقييم. ونُشَارِك نماذجنا وشفراتنا المصدرية عبر الرابط التالي: https://github.com/mlfoundations/open_flamingo.