التاريخ

منذ 2 أعوام

الحجم

1.28 GB

المؤسسة

رابط الورقة البحثية

arxiv.org

الوسوم

ذكاء اصطناعي للعلوم

تم إطلاق مجموعة البيانات هذه بواسطة فريق بحثي من Google Research وجامعة جونز هوبكنز في عام 2024. نتائج الورقة ذات الصلة هي "SPIQA: مجموعة بيانات للإجابة على الأسئلة متعددة الوسائط في الأوراق العلمية".

خلفية

يعد العثور على إجابات للأسئلة في المقالات البحثية العلمية الطويلة مجالًا مهمًا من مجالات البحث التي تساعد القراء على حل استفساراتهم بسرعة. ومع ذلك، فإن مجموعات البيانات الحالية للإجابة على الأسئلة (QA) المستندة إلى الأوراق العلمية محدودة الحجم وتركز فقط على المحتوى النصي. ولمعالجة هذا القيد، أطلق فريق البحث برنامج SPIQA (الإجابة على أسئلة الصور في الأوراق العلمية).

نظرة عامة على مجموعة البيانات

هذه هي أول مجموعة بيانات ضمان الجودة واسعة النطاق مصممة خصيصًا لتفسير الأشكال والجداول المعقدة في المقالات البحثية العلمية في مختلف مجالات علوم الكمبيوتر. استفد من الخبرة وقدرات فهم الرسوم البيانية لنماذج اللغة الكبيرة متعددة الوسائط (MLLMs). قام فريق البحث بتصميم مهمة بحث عن المعلومات تتضمن صورًا متعددة تغطي مجموعة متنوعة من المخططات والجداول والرسوم البيانية وتصورات النتائج، باستخدام كل من التنظيم التلقائي واليدوي لإنشاء مجموعة البيانات. يحتوي SPIQA على 270 ألف سؤال مقسمة إلى أجزاء التدريب والتحقق وثلاثة أجزاء تقييم مختلفة. ومن خلال إجراء تجارب موسعة على 12 نموذجًا أساسيًا معروفًا، قام الفريق بتقييم قدرة الأنظمة المتعددة الوسائط الحالية على فهم الجوانب الدقيقة للمقالات البحثية.

الاستشهاد

@article{pramanick2024spiqa, title={SPIQA: مجموعة بيانات للإجابة على الأسئلة متعددة الوسائط حول الأوراق العلمية}, المؤلف={برامانيك، شرامان وتشيلابا، راما وفينوجوبالان، سوبهاشيني}، journal={NeurIPS}, السنة = {2024} }

SPIQA.torrent

البذر 1جارٍ التنزيل 0مكتمل 248إجمالي التنزيلات 297

SPIQA/
- README.md
  1.95 KB
- README.txt
  3.89 KB

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

منذ 9 أيام

مجموعة بيانات تقييم قدرة تحليل المستندات في ParseBench

منذ 2 أشهر

مجموعة بيانات MIA للاستدلال متعدد الخطوات ومسار القرار

منذ 2 أشهر

مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT

منذ 9 أيام

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

منذ 9 أيام

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

منذ 9 أيام

مجموعة بيانات CHOCLO المعيارية الثقافية لأمريكا اللاتينية

منذ 3 أشهر

مجموعة بيانات DRACO المعيارية للبحوث المعمقة متعددة المجالات

منذ 2 أشهر

مجموعة بيانات حوار التعلم لأدوات ToolACE المعقدة

منذ 3 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

استخدم مجموعة البيانات هذه

ناقش على Discord

التاريخ

منذ 2 أعوام

الحجم

1.28 GB

المؤسسة

رابط الورقة البحثية

arxiv.org

الوسوم

ذكاء اصطناعي للعلوم

خلفية

نظرة عامة على مجموعة البيانات

الاستشهاد

SPIQA.torrent

البذر 1جارٍ التنزيل 0مكتمل 248إجمالي التنزيلات 297

SPIQA/
- README.md
  1.95 KB
- README.txt
  3.89 KB

منذ 3 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

مجموعة بيانات الإجابة على أسئلة الأوراق العلمية متعددة الوسائط SPIQA

خلفية

نظرة عامة على مجموعة البيانات

الاستشهاد

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات الإجابة على أسئلة الأوراق العلمية متعددة الوسائط SPIQA

خلفية

نظرة عامة على مجموعة البيانات

الاستشهاد

مجموعات البيانات ذات الصلة

استعلام عن نطاقات حرفية، شرط الاستعلام، استخراج الأدلة، مجموعة البيانات

مجموعة بيانات مرجعية لتوليد الرسوم التوضيحية العلمية من FigureBench

فهم مخطط ChartNet لمجموعة البيانات متعددة الوسائط

مجموعة بيانات قاعدة المعرفة المستهدفة للكيميرا TACK

مجموعة بيانات DeepCrack للكشف عن تشققات البنية التحتية

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

مجموعة بيانات LongBlocks للإجابة على الأسئلة متعددة اللغات ذات السياق الطويل

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

مجموعة بيانات تصنيف أمراض قاع العين

مجموعة بيانات الكشف عن حرائق الغابات والدخان من مسافات بعيدة

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات تقييم قدرة تحليل المستندات في ParseBench

مجموعة بيانات MIA للاستدلال متعدد الخطوات ومسار القرار

مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

مجموعة بيانات CHOCLO المعيارية الثقافية لأمريكا اللاتينية

مجموعة بيانات DRACO المعيارية للبحوث المعمقة متعددة المجالات

مجموعة بيانات حوار التعلم لأدوات ToolACE المعقدة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات الإجابة على أسئلة الأوراق العلمية متعددة الوسائط SPIQA

خلفية

نظرة عامة على مجموعة البيانات

الاستشهاد

مجموعات البيانات ذات الصلة

استعلام عن نطاقات حرفية، شرط الاستعلام، استخراج الأدلة، مجموعة البيانات

مجموعة بيانات مرجعية لتوليد الرسوم التوضيحية العلمية من FigureBench

فهم مخطط ChartNet لمجموعة البيانات متعددة الوسائط

مجموعة بيانات قاعدة المعرفة المستهدفة للكيميرا TACK

مجموعة بيانات DeepCrack للكشف عن تشققات البنية التحتية

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

مجموعة بيانات LongBlocks للإجابة على الأسئلة متعددة اللغات ذات السياق الطويل

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

مجموعة بيانات تصنيف أمراض قاع العين

مجموعة بيانات الكشف عن حرائق الغابات والدخان من مسافات بعيدة

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات تقييم قدرة تحليل المستندات في ParseBench

مجموعة بيانات MIA للاستدلال متعدد الخطوات ومسار القرار

مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

مجموعة بيانات MDPBench المعيارية لتحليل المستندات متعددة اللغات

مجموعة بيانات CHOCLO المعيارية الثقافية لأمريكا اللاتينية

مجموعة بيانات DRACO المعيارية للبحوث المعمقة متعددة المجالات

مجموعة بيانات حوار التعلم لأدوات ToolACE المعقدة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

مجموعات البيانات ذات الصلة

استعلام عن نطاقات حرفية، شرط الاستعلام، استخراج الأدلة، مجموعة البيانات

مجموعة بيانات مرجعية لتوليد الرسوم التوضيحية العلمية من FigureBench

فهم مخطط ChartNet لمجموعة البيانات متعددة الوسائط

مجموعة بيانات قاعدة المعرفة المستهدفة للكيميرا TACK

مجموعة بيانات DeepCrack للكشف عن تشققات البنية التحتية

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

مجموعة بيانات LongBlocks للإجابة على الأسئلة متعددة اللغات ذات السياق الطويل

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

مجموعة بيانات تصنيف أمراض قاع العين

مجموعة بيانات الكشف عن حرائق الغابات والدخان من مسافات بعيدة

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات تقييم قدرة تحليل المستندات في ParseBench

مجموعة بيانات MIA للاستدلال متعدد الخطوات ومسار القرار

مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench