HyperAI

ChartQA: مجموعة بيانات مرجعية للإجابة على الأسئلة المتعلقة بالرسوم البيانية باستخدام التفكير البصري والمنطقي

التاريخ

منذ عام واحد

الحجم

860.58 MB

المؤسسة

رابط النشر

github.com

特色图像

خلفية مجموعة البيانات

تحظى المخططات البيانية بشعبية كبيرة في تحليل البيانات. عند استكشاف الرسوم البيانية، غالبًا ما يطرح الأشخاص مجموعة متنوعة من الأسئلة المنطقية المعقدة التي تتضمن عمليات منطقية وحسابية متعددة. كما ذكروا في كثير من الأحيان الميزات المرئية للرسوم البيانية في أسئلتهم. ومع ذلك، فإن معظم مجموعات البيانات الموجودة لا تركز على مثل هذه المشكلات المنطقية المعقدة لأن أسئلتها تعتمد على قوالب وتأتي الإجابات من مفردات ثابتة.

مقدمة مجموعة البيانات

في هذا العمل، اقترح فريق البحث معيارًا واسع النطاق، ChartQA، يغطي 9.6 ألف سؤال مكتوب من قبل الإنسان و23.1 ألف سؤال تم إنشاؤها من ملخصات الرسوم البيانية المكتوبة من قبل الإنسان.

يتنبأ نظام الإجابة على الأسئلة المخططية (ChartQA) بالإجابة عن طريق إدخال مخطط وسؤال باللغة الطبيعية. على عكس ضمان الجودة النصي، تحتوي المخططات البيانية في ChartQA على تمثيلات مرئية، وقد ينتبه القراء أكثر إلى بعض الميزات البارزة، مثل الاتجاهات والقيم المتطرفة وما إلى ذلك. تحتوي مجموعة البيانات على رسوم بيانية واقعية وأزواج أسئلة وأجوبة مكتوبة يدويًا.

يختلف ChartQA عن مجموعات البيانات السابقة بطريقتين:

نوع السؤال: من تأليف الإنسان مقابل سؤال قائم على قالب
مصدر الرسم البياني: العالم الحقيقي مقابل الذي تم إنشاؤه باستخدام أداة

جمع البيانات

جمع البيانات وإعدادها

مأخوذة من أربعة مواقع ويب رسومية، تغطي موضوعات مختلفة وأنماط متنوعة. يمكن الزحف إلى كافة المحتوى الموجود على موقع الويب والذي يحتوي على جدول البيانات الأساسي.

شرح البيانات

هناك طريقتان رئيسيتان للتعليق التوضيحي:

استخدم AMT (Amazon Mechanical Turk) لجمع أزواج ضمان الجودة المكتوبة يدويًا.

أسئلة تركيبية تحمل علامات بشرية (تحتوي على عمليتين على الأقل) وأسئلة مرئية.

إنشاء أزواج ضمان الجودة من الأزواج التي كتبها الإنسان من Statista.

ChartQA.torrent
البذر 1التنزيل 1مكتمل 90إجمالي التنزيلات 129
  • ChartQA/
    • README.md
      2.29 KB
    • README.txt
      4.58 KB
      • data/
        • ChartQA Dataset.zip
          860.58 MB