التاريخ

منذ 4 أشهر

المؤسسة

رابط الورقة البحثية

2509.02473

الترخيص

CC BY 4.0

الوسوم

معالجة اللغة الطبيعية

FDAbench-Full هو أول معيار مرجعي لمهام تحليل البيانات غير المتجانسة لوكلاء البيانات، أصدرته جامعة نانيانغ التكنولوجية والجامعة الوطنية في سنغافورة وشركة هواوي تكنولوجيز المحدودة في عام 2025. نتائج الورقة ذات الصلة هي "FDABench: معيار لوكلاء البيانات في الاستعلامات التحليلية على البيانات غير المتجانسة"، والذي يهدف إلى تقييم قدرات النموذج في توليد استعلامات قاعدة البيانات، وفهم SQL، وتحليل البيانات المالية.

تحتوي مجموعة البيانات على 2007 مهمة تحليل عالية الجودة، تغطي نطاقًا متنوعًا من مجالات البيانات ومستويات الصعوبة وفئات المهام. يتضمن كل مثال حقول بيانات وصفية كاملة، بما في ذلك: task_id (معرّف المهمة الفريد)، وinstance_id (معرّف المثيل)، وdb (اسم/معرّف قاعدة البيانات)، وlevel (مستوى الصعوبة: سهل/متوسط/صعب)، وdata_type (نوع نظام قاعدة البيانات)، وquestion_type (فئة السؤال)، وtools_available (قائمة الأدوات المتاحة)، وquery (نص السؤال/الاستعلام الرئيسي).

بنية مجموعة البيانات

تحتوي مجموعة البيانات على ثلاثة أنواع من المهام:

أسئلة الاختيار من واحد: يوجد 579 سؤالاً مُصممة بعناية، ولكل منها إجابة صحيحة واحدة فقط. تُستخدم هذه الأسئلة بشكل رئيسي لاختبار فهم النموذج لمفاهيم قواعد البيانات واستعلامات SQL.
أسئلة الاختيار من متعدد: ما مجموعه 760 سؤالاً معقداً مع عدة احتمالات لإجابات صحيحة. تتضمن هذه الأسئلة نتائج حسابية رقمية دقيقة واستنتاجات مبنية على المنطق، وتُستخدم لتقييم الأداء الشامل للنموذج في تحليل البيانات وقدراته على المنطق.
إنشاء التقارير (التقرير): يتطلب إجمالي 668 سؤالاً إنشاء تقارير تحليل مفصلة، واختبار قدرة وكيل البيانات على إجراء تحليل شامل في بيئة متعددة مصادر البيانات، وتوفير تقرير قياسي كمعيار تقييم مقارن.

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعة بيانات الاستعلام باللغة الطبيعية للبيانات شبه المهيكلة SSRB

منذ 2 أشهر

مجموعة بيانات DeepSearchQA للبحث عن المعلومات متعددة الخطوات والإجابة على الأسئلة

منذ شهر واحد

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

ناقش على Discord

التاريخ

منذ 4 أشهر

المؤسسة

رابط الورقة البحثية

2509.02473

الترخيص

CC BY 4.0

الوسوم

معالجة اللغة الطبيعية

بنية مجموعة البيانات

تحتوي مجموعة البيانات على ثلاثة أنواع من المهام:

أسئلة الاختيار من واحد: يوجد 579 سؤالاً مُصممة بعناية، ولكل منها إجابة صحيحة واحدة فقط. تُستخدم هذه الأسئلة بشكل رئيسي لاختبار فهم النموذج لمفاهيم قواعد البيانات واستعلامات SQL.
أسئلة الاختيار من متعدد: ما مجموعه 760 سؤالاً معقداً مع عدة احتمالات لإجابات صحيحة. تتضمن هذه الأسئلة نتائج حسابية رقمية دقيقة واستنتاجات مبنية على المنطق، وتُستخدم لتقييم الأداء الشامل للنموذج في تحليل البيانات وقدراته على المنطق.
إنشاء التقارير (التقرير): يتطلب إجمالي 668 سؤالاً إنشاء تقارير تحليل مفصلة، واختبار قدرة وكيل البيانات على إجراء تحليل شامل في بيئة متعددة مصادر البيانات، وتوفير تقرير قياسي كمعيار تقييم مقارن.

مجموعة بيانات الاستعلام باللغة الطبيعية للبيانات شبه المهيكلة SSRB

منذ 2 أشهر

مجموعة بيانات DeepSearchQA للبحث عن المعلومات متعددة الخطوات والإجابة على الأسئلة

منذ شهر واحد

مجموعة بيانات MCIF متعددة الوسائط لتتبع التعليمات عبر اللغات

منذ شهر واحد

واجهة VenusBench-GD متعددة المنصات لفهم مجموعة البيانات

منذ شهر واحد

مجموعة بيانات تقييم فهم المشاهد المعقدة من GroundingME

منذ شهر واحد

مجموعة بيانات التقييم الشامل للسياق الطويل لبرنامج LongBench-Pro

منذ شهر واحد

مجموعة بيانات FirstAidQA للإجابة على أسئلة المعرفة في الإسعافات الأولية

منذ 2 أشهر

مجموعة بيانات Spatial-SSRL-81k للوعي المكاني ذاتي الإشراف

منذ 2 أشهر

مجموعة بيانات معيار HumanSense

منذ 3 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

FDAbench-مجموعة بيانات مرجعية كاملة لتحليل البيانات غير المتجانسة

بنية مجموعة البيانات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

FDAbench-مجموعة بيانات مرجعية كاملة لتحليل البيانات غير المتجانسة

بنية مجموعة البيانات

ذات صلة مجموعات بيانات

مجموعة بيانات الاستعلام باللغة الطبيعية للبيانات شبه المهيكلة SSRB

مجموعة بيانات DeepSearchQA للبحث عن المعلومات متعددة الخطوات والإجابة على الأسئلة

مجموعة بيانات MCIF متعددة الوسائط لتتبع التعليمات عبر اللغات

واجهة VenusBench-GD متعددة المنصات لفهم مجموعة البيانات

مجموعة بيانات تقييم فهم المشاهد المعقدة من GroundingME

مجموعة بيانات التقييم الشامل للسياق الطويل لبرنامج LongBench-Pro

مجموعة بيانات FirstAidQA للإجابة على أسئلة المعرفة في الإسعافات الأولية

مجموعة بيانات Spatial-SSRL-81k للوعي المكاني ذاتي الإشراف

مجموعة بيانات معيار HumanSense

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

FDAbench-مجموعة بيانات مرجعية كاملة لتحليل البيانات غير المتجانسة

بنية مجموعة البيانات

ذات صلة مجموعات بيانات

مجموعة بيانات الاستعلام باللغة الطبيعية للبيانات شبه المهيكلة SSRB

مجموعة بيانات DeepSearchQA للبحث عن المعلومات متعددة الخطوات والإجابة على الأسئلة

مجموعة بيانات MCIF متعددة الوسائط لتتبع التعليمات عبر اللغات

واجهة VenusBench-GD متعددة المنصات لفهم مجموعة البيانات

مجموعة بيانات تقييم فهم المشاهد المعقدة من GroundingME

مجموعة بيانات التقييم الشامل للسياق الطويل لبرنامج LongBench-Pro

مجموعة بيانات FirstAidQA للإجابة على أسئلة المعرفة في الإسعافات الأولية

مجموعة بيانات Spatial-SSRL-81k للوعي المكاني ذاتي الإشراف

مجموعة بيانات معيار HumanSense

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة مجموعات بيانات

مجموعة بيانات الاستعلام باللغة الطبيعية للبيانات شبه المهيكلة SSRB

مجموعة بيانات DeepSearchQA للبحث عن المعلومات متعددة الخطوات والإجابة على الأسئلة

مجموعة بيانات MCIF متعددة الوسائط لتتبع التعليمات عبر اللغات

واجهة VenusBench-GD متعددة المنصات لفهم مجموعة البيانات

مجموعة بيانات تقييم فهم المشاهد المعقدة من GroundingME

مجموعة بيانات التقييم الشامل للسياق الطويل لبرنامج LongBench-Pro

مجموعة بيانات FirstAidQA للإجابة على أسئلة المعرفة في الإسعافات الأولية

مجموعة بيانات Spatial-SSRL-81k للوعي المكاني ذاتي الإشراف

مجموعة بيانات معيار HumanSense

ذات صلة مجموعات بيانات

مجموعة بيانات الاستعلام باللغة الطبيعية للبيانات شبه المهيكلة SSRB

مجموعة بيانات DeepSearchQA للبحث عن المعلومات متعددة الخطوات والإجابة على الأسئلة

مجموعة بيانات MCIF متعددة الوسائط لتتبع التعليمات عبر اللغات

واجهة VenusBench-GD متعددة المنصات لفهم مجموعة البيانات

مجموعة بيانات تقييم فهم المشاهد المعقدة من GroundingME

مجموعة بيانات التقييم الشامل للسياق الطويل لبرنامج LongBench-Pro

مجموعة بيانات FirstAidQA للإجابة على أسئلة المعرفة في الإسعافات الأولية

مجموعة بيانات Spatial-SSRL-81k للوعي المكاني ذاتي الإشراف

مجموعة بيانات معيار HumanSense