M³IT: مجموعة بيانات ضبط التعليمات متعددة الأوضاع ومتعددة اللغات
التاريخ
منذ عام واحد
رابط النشر
العلامات
الفئات
تتكون مجموعة البيانات من 40 مجموعة بيانات.ويتضمن ذلك 2.4 مليون حالة و400 تعليمات مهمة مكتوبة يدويًا.وتمت إعادة تنسيقها إلى بنية نصية مرئية. تجمع مجموعة البيانات مجموعة متنوعة من المهام من مهام الرؤية واللغة الكلاسيكية، بما في ذلك الترجمة التوضيحية، والإجابة على الأسئلة البصرية (VQA)، وتوليد الشرط البصري، والاستدلال، والتصنيف.