مجموعة بيانات الإجابة على أسئلة الصور DVQA
التاريخ
الحجم
رابط النشر
العلامات

هذه المجموعة من البيانات عبارة عن ورقة بحثية من معهد روتشستر للتكنولوجيا وAdobe Research DVQA: فهم تصورات البيانات من خلال الإجابة على الأسئلة مجموعة البيانات المقترحة في . تحتوي مجموعة البيانات على ثلاثة مجلدات: مجلد الصور، ومجلد أزواج الأسئلة والأجوبة، ومجلد بيانات التعريف للمخطط الشريطي.
تُعد المخططات الشريطية وسيلة فعالة لنقل المعلومات الرقمية، إلا أن الخوارزميات الحالية لا تستطيع تحليلها. إن الأساليب الحالية تفشل عندما تواجه حتى تغييرات طفيفة في المظهر.واقترح فريق البحث DVQA، وهي مجموعة بيانات تختبر العديد من جوانب فهم الرسم البياني في إطار الإجابة على الأسئلة.. يختلف DVQA عن الإجابة المرئية على الأسئلة (VQA)، حيث يحتاج إلى معالجة الكلمات والإجابات الفريدة لرسم بياني شريطي معين. إن خوارزميات VQA الحديثة تعمل بشكل ضعيف على DVQA، وقد اقترح فريق البحث خطين أساسيين قويين يعملان بشكل أفضل. وسيتيح عمل فريق البحث للخوارزميات استخراج المعلومات الرقمية والدلالية بشكل تلقائي من أعداد كبيرة من الرسوم البيانية الشريطية الموجودة في المنشورات العلمية ومقالات الإنترنت وتقارير الأعمال والعديد من المجالات الأخرى.
يتم إنشاء مجموعة بيانات DVQA باستخدام matplotlib. هناك نوعان من الأسئلة في مجموعة البيانات: الأول هو سؤال عام مشترك بين كل مخطط، والآخر هو سؤال خاص صالح لمخطط معين.
وتغطي الأسئلة ثلاثة جوانب: أ) فهم البنية، ب) استرجاع البيانات، ج) استدلال البيانات. انظر الصورة أعلاه للحصول على مثال.
تتضمن مجموعة الاختبار نوعين من الأسئلة التي تغطي مجموعة من الكلمات: الاختبار المألوف يشمل فقط الكلمات الموجودة في مجموعة التدريب، والاختبار الجديد يشمل أيضًا الكلمات التي ظهرت حديثًا.