HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الإجابة على أسئلة الأوراق العلمية متعددة الوسائط SPIQA

Date

منذ عام واحد

Size

1.28 GB

Organization

بحث جوجل
جامعة جونز هوبكنز

Paper URL

arxiv.org

تم إطلاق مجموعة البيانات هذه بواسطة فريق بحثي من Google Research وجامعة جونز هوبكنز في عام 2024. نتائج الورقة ذات الصلة هي "SPIQA: مجموعة بيانات للإجابة على الأسئلة متعددة الوسائط في الأوراق العلمية".

خلفية

يعد العثور على إجابات للأسئلة في المقالات البحثية العلمية الطويلة مجالًا مهمًا من مجالات البحث التي تساعد القراء على حل استفساراتهم بسرعة. ومع ذلك، فإن مجموعات البيانات الحالية للإجابة على الأسئلة (QA) المستندة إلى الأوراق العلمية محدودة الحجم وتركز فقط على المحتوى النصي. ولمعالجة هذا القيد، أطلق فريق البحث برنامج SPIQA (الإجابة على أسئلة الصور في الأوراق العلمية).

نظرة عامة على مجموعة البيانات

هذه هي أول مجموعة بيانات ضمان الجودة واسعة النطاق مصممة خصيصًا لتفسير الأشكال والجداول المعقدة في المقالات البحثية العلمية في مختلف مجالات علوم الكمبيوتر. استفد من الخبرة وقدرات فهم الرسوم البيانية لنماذج اللغة الكبيرة متعددة الوسائط (MLLMs). قام فريق البحث بتصميم مهمة بحث عن المعلومات تتضمن صورًا متعددة تغطي مجموعة متنوعة من المخططات والجداول والرسوم البيانية وتصورات النتائج، باستخدام كل من التنظيم التلقائي واليدوي لإنشاء مجموعة البيانات. يحتوي SPIQA على 270 ألف سؤال مقسمة إلى أجزاء التدريب والتحقق وثلاثة أجزاء تقييم مختلفة. ومن خلال إجراء تجارب موسعة على 12 نموذجًا أساسيًا معروفًا، قام الفريق بتقييم قدرة الأنظمة المتعددة الوسائط الحالية على فهم الجوانب الدقيقة للمقالات البحثية.

SPIQA.torrent
Seeding 1Downloading 0Completed 190Total Downloads 227
  • SPIQA/
    • README.md
      1.95 KB
    • README.txt
      3.89 KB
      • data/
        • spiqa.zip
          1.28 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مجموعة بيانات الإجابة على أسئلة الأوراق العلمية متعددة الوسائط SPIQA | Datasets | HyperAI