HyperAI

مجموعة بيانات GITQA للإجابة على أسئلة الاستدلال البياني متعدد الوسائط 

مساعدة التنزيل
特色图像

GITQA هي أول مجموعة بيانات للإجابة على الأسئلة المنطقية تحتوي على رسوم بيانية مرئية، تم إنشاؤها بواسطة جامعة هونج كونج للعلوم والتكنولوجيا وجامعة جنوب العلوم والتكنولوجيا من خلال رسم هياكل الرسوم البيانية في صور مرئية ذات أنماط مختلفة. تحتوي مجموعة البيانات على أكثر من 423 ألف نموذج للإجابة على الأسئلة، يحتوي كل منها على معلومات نصية ورسومية ومرئية مقابلة وزوج الأسئلة والإجابات المقابل.

تحتوي مجموعة البيانات على نسختين: GITQA-Base وGITQA-Aug، حيث يحتوي GITQA-Base فقط على صور مرئية ذات نمط واحد. GITQA-Aug أكثر ثراءً. يقوم بإجراء عمليات تكبير البيانات المختلفة على الرسم البياني المرئي، بما في ذلك تغيير التخطيط وشكل النقاط وعرض الحواف ونمط النقاط، وبالتالي توفير تمثيلات بيانية مرئية أكثر تنوعًا. يمكن استخدام مجموعة البيانات هذه لتقييم أداء LLM المستند إلى وصف النص وMLLM المتعدد الوسائط في مهام التفكير البياني، ودراسة تأثير المعلومات المرئية على التفكير البياني.