Command Palette
Search for a command to run...
Pythia v0.1: المدخل الفائز في تحدي VQA 2018
Pythia v0.1: المدخل الفائز في تحدي VQA 2018
Yu Jiang* Vivek Natarajan* Xinlei Chen* Marcus Rohrbach Dhruv Batra Devi Parikh
الملخص
يصف هذا الوثيقة نموذج Pythia v0.1، الفائز في تحدي VQA 2018 من فريق A-STAR التابع لـ Facebook AI Research (FAIR). نقطة انطلاقنا هي إعادة تنفيذ نمودجية للنموذج السفلي-العلوي (bottom-up top-down) (up-down). نوضح أن بإمكاننا تحسين أداء النموذج up-down على مجموعة بيانات VQA v2.0 بشكل كبير - من 65.67٪ إلى 70.22٪ - من خلال إجراء تغييرات دقيقة ولكن مهمة في هندسة النموذج وجدول معدل التعلم، بالإضافة إلى ضبط خصائص الصور وإضافة زيادة البيانات.بالإضافة إلى ذلك، باستخدام مزيج متنوع من النماذج المدربة بخصائص مختلفة وعلى مجموعات بيانات مختلفة، تمكنا من تحسين الأداء بشكل كبير عن الطريقة "القياسية" للتجميع (أي نفس النموذج مع بذور عشوائية مختلفة) بمقدار 1.31٪. بشكل عام، حققنا نسبة 72.27٪ على التقسيم test-std لمجموعة بيانات VQA v2.0. يتوفر كودنا الكامل (التدريب، التقييم، زيادة البيانات، التجميع) والنماذج المدربة مسبقًا بشكل عام في: https://github.com/facebookresearch/pythia