التاريخ

منذ 6 أشهر

المؤسسة

رابط الورقة البحثية

LuMGoG6lBA

الترخيص

Apache 2.0

الوسوم

LLM

معالجة اللغة الطبيعية

توليد مدعوم بالاسترجاع

SSRB هي مجموعة بيانات مرجعية واسعة النطاق للاستعلام باللغة الطبيعية عن البيانات شبه المهيكلة، وقد أصدرها معهد هاربين للتكنولوجيا (شنتشن) عام 2025 بالتعاون مع جامعة هونغ كونغ للفنون التطبيقية وجامعة تسينغهوا ومؤسسات أخرى. وتشمل الأبحاث ذات الصلة... SSRB: الاستعلام المباشر باللغة الطبيعية عن البيانات شبه المهيكلة الضخمة غير المتجانسةتم اختيارها لمجموعات بيانات ومعايير NeurIPS 2025، والتي تهدف إلى تقييم وتعزيز قدرة النموذج على استرجاع البيانات شبه المهيكلة في ظل ظروف استعلام اللغة الطبيعية المعقدة. تحتوي هذه المجموعة من البيانات على ما يقارب 14 مليون عنصر بيانات شبه مهيكلة و8485 استعلامًا اختباريًا، تغطي ستة مجالات مختلفة وتتضمن 99 نمطًا مختلفًا. يُلبي كل استعلام في هذه المجموعة متطلبات استرجاع البيانات شبه المهيكلة. تجمع شروط الاستعلام عادةً بين قيود مطابقة الحقول الدقيقة ومتطلبات المطابقة الدلالية التقريبية، وقد تتضمن حقولًا متعددة واستدلالًا ضمنيًا. تُستخدم هذه المجموعة لتقييم قدرة النموذج بشكل منهجي على استرجاع وفهم البيانات شبه المهيكلة في ظل شروط استعلام معقدة.

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

ناقش على Discord

التاريخ

منذ 6 أشهر

المؤسسة

رابط الورقة البحثية

LuMGoG6lBA

الترخيص

Apache 2.0

الوسوم

LLM

معالجة اللغة الطبيعية

توليد مدعوم بالاسترجاع

مجموعات البيانات ذات الصلة

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

مجموعة بيانات الاستعلام باللغة الطبيعية للبيانات شبه المهيكلة SSRB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات الاستعلام باللغة الطبيعية للبيانات شبه المهيكلة SSRB

مجموعات البيانات ذات الصلة

مجموعة بيانات DRACO المعيارية للبحوث المعمقة متعددة المجالات

مجموعة بيانات حوار التعلم لأدوات ToolACE المعقدة

مجموعة بيانات اصطناعية للاستدلال العام من CHIMERA

مجموعة بيانات تخطيط الدماغ الكهربائي THINGS-EEG

مجموعة بيانات تخطيط الدماغ المغناطيسي THINGS-MEG

مجموعة بيانات التصوير بالرنين المغناطيسي الوظيفي THINGS-fMRI

مجموعة بيانات إنشاء فيديو RoVid-X Robot

مجموعة بيانات LightOnOCR-mix-0126 لنسخ النصوص

مجموعة بيانات كشف السقوط في حوادث كاميرات المراقبة

مجموعة بيانات تقييم فهم المشاهد المعقدة من GroundingME

مجموعة بيانات MCIF متعددة الوسائط لتتبع التعليمات عبر اللغات

مجموعة بيانات الاستدلال متعدد المهام TxT360-3efforts

مجموعة بيانات التقييم الشامل للسياق الطويل لبرنامج LongBench-Pro

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات الاستعلام باللغة الطبيعية للبيانات شبه المهيكلة SSRB

مجموعات البيانات ذات الصلة

مجموعة بيانات DRACO المعيارية للبحوث المعمقة متعددة المجالات

مجموعة بيانات حوار التعلم لأدوات ToolACE المعقدة

مجموعة بيانات اصطناعية للاستدلال العام من CHIMERA

مجموعة بيانات تخطيط الدماغ الكهربائي THINGS-EEG

مجموعة بيانات تخطيط الدماغ المغناطيسي THINGS-MEG

مجموعة بيانات التصوير بالرنين المغناطيسي الوظيفي THINGS-fMRI

مجموعة بيانات إنشاء فيديو RoVid-X Robot

مجموعة بيانات LightOnOCR-mix-0126 لنسخ النصوص

مجموعة بيانات كشف السقوط في حوادث كاميرات المراقبة

مجموعة بيانات تقييم فهم المشاهد المعقدة من GroundingME

مجموعة بيانات MCIF متعددة الوسائط لتتبع التعليمات عبر اللغات

مجموعة بيانات الاستدلال متعدد المهام TxT360-3efforts

مجموعة بيانات التقييم الشامل للسياق الطويل لبرنامج LongBench-Pro

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

مجموعات البيانات ذات الصلة

مجموعة بيانات DRACO المعيارية للبحوث المعمقة متعددة المجالات

مجموعة بيانات حوار التعلم لأدوات ToolACE المعقدة

مجموعة بيانات اصطناعية للاستدلال العام من CHIMERA

مجموعة بيانات تخطيط الدماغ الكهربائي THINGS-EEG

مجموعة بيانات تخطيط الدماغ المغناطيسي THINGS-MEG

مجموعة بيانات التصوير بالرنين المغناطيسي الوظيفي THINGS-fMRI

مجموعة بيانات إنشاء فيديو RoVid-X Robot

مجموعة بيانات LightOnOCR-mix-0126 لنسخ النصوص

مجموعة بيانات كشف السقوط في حوادث كاميرات المراقبة

مجموعة بيانات تقييم فهم المشاهد المعقدة من GroundingME

مجموعة بيانات MCIF متعددة الوسائط لتتبع التعليمات عبر اللغات

مجموعة بيانات الاستدلال متعدد المهام TxT360-3efforts

مجموعة بيانات التقييم الشامل للسياق الطويل لبرنامج LongBench-Pro

مجموعات البيانات ذات الصلة

مجموعة بيانات DRACO المعيارية للبحوث المعمقة متعددة المجالات

مجموعة بيانات حوار التعلم لأدوات ToolACE المعقدة

مجموعة بيانات اصطناعية للاستدلال العام من CHIMERA

مجموعة بيانات تخطيط الدماغ الكهربائي THINGS-EEG

مجموعة بيانات تخطيط الدماغ المغناطيسي THINGS-MEG

مجموعة بيانات التصوير بالرنين المغناطيسي الوظيفي THINGS-fMRI

مجموعة بيانات إنشاء فيديو RoVid-X Robot

مجموعة بيانات LightOnOCR-mix-0126 لنسخ النصوص

مجموعة بيانات كشف السقوط في حوادث كاميرات المراقبة

مجموعة بيانات تقييم فهم المشاهد المعقدة من GroundingME

مجموعة بيانات MCIF متعددة الوسائط لتتبع التعليمات عبر اللغات

مجموعة بيانات الاستدلال متعدد المهام TxT360-3efforts

مجموعة بيانات التقييم الشامل للسياق الطويل لبرنامج LongBench-Pro