Command Palette
Search for a command to run...
مجموعة بيانات DeepSearchQA للبحث عن المعلومات متعددة الخطوات والإجابة على الأسئلة
التاريخ
عنوان URL للنشر
رابط الورقة البحثية
الترخيص
Apache 2.0
DeepSearchQA هي مجموعة بيانات لاسترجاع المعلومات وتقييم الحقائق لنماذج اللغة الكبيرة والوكلاء الأذكياء، وقد أصدرتها جوجل ديب مايند في عام 2025. وتشمل الأبحاث ذات الصلة ما يلي... DeepSearchQA: سد فجوة الشمولية لوكلاء البحث المتعمقالهدف هو تقييم قدرة النموذج على التخطيط، وقدرته على الحفاظ على السياق، واستخدامه الشامل لمعلومات الشبكة المفتوحة في مهام البحث عن المعلومات المعقدة ومتعددة الخطوات.
تحتوي هذه المجموعة من البيانات على 900 عينة تقييم مصممة يدويًا تغطي 17 مجالًا مختلفًا. تتكون كل عينة من سؤال، وفئة مجال السؤال المقابلة، وإجابة نموذجية للتقييم، وتصنيف لنوع الإجابة. تُصنف أنواع الإجابات إلى إجابات فردية وإجابات جماعية، مع ما يقارب 651 سؤالًا من نوع TP3T تتطلب من النموذج تقديم مجموعة كاملة من الإجابات. صُممت جميع الأسئلة بصيغة "سلسلة سببية"، ما يعني أن استرجاع المعلومات اللاحق يعتمد على نتائج البحث في الخطوات السابقة، الأمر الذي يتطلب من النموذج تنفيذ خطط بحث متعددة الخطوات والحفاظ على اتساق سياقي طويل الأمد. تستند جميع المهام إلى شبكات مفتوحة، ما يضمن إجابات موضوعية وقابلة للتحقق. تُستخدم هذه المجموعة بشكل أساسي لتقييم نماذج اللغة الكبيرة أو أنظمة الوكلاء الأذكياء ذات إمكانيات البحث الشبكي.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.