HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات GITQA للإجابة على أسئلة الاستدلال البياني متعدد الوسائط 

انضم إلى مجتمع Discord
Featured Image

GITQA هي أول مجموعة بيانات للإجابة على الأسئلة المنطقية تحتوي على رسوم بيانية مرئية، تم إنشاؤها بواسطة جامعة هونج كونج للعلوم والتكنولوجيا وجامعة جنوب العلوم والتكنولوجيا من خلال رسم هياكل الرسوم البيانية في صور مرئية ذات أنماط مختلفة. تحتوي مجموعة البيانات على أكثر من 423 ألف نموذج للإجابة على الأسئلة، يحتوي كل منها على معلومات نصية ورسومية ومرئية مقابلة وزوج الأسئلة والإجابات المقابل.

تحتوي مجموعة البيانات على نسختين: GITQA-Base وGITQA-Aug، حيث يحتوي GITQA-Base فقط على صور مرئية ذات نمط واحد. GITQA-Aug أكثر ثراءً. يقوم بإجراء عمليات تكبير البيانات المختلفة على الرسم البياني المرئي، بما في ذلك تغيير التخطيط وشكل النقاط وعرض الحواف ونمط النقاط، وبالتالي توفير تمثيلات بيانية مرئية أكثر تنوعًا. يمكن استخدام مجموعة البيانات هذه لتقييم أداء LLM المستند إلى وصف النص وMLLM المتعدد الوسائط في مهام التفكير البياني، ودراسة تأثير المعلومات المرئية على التفكير البياني.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مجموعة بيانات GITQA للإجابة على أسئلة الاستدلال البياني متعدد الوسائط  | مجموعات البيانات | HyperAI