Command Palette
Search for a command to run...
مجموعة بيانات DeepSearchQA للبحث عن المعلومات متعددة الخطوات والإجابة على الأسئلة
Date
Publish URL
Paper URL
License
Apache 2.0
DeepSearchQA هي مجموعة بيانات لاسترجاع المعلومات وتقييم الحقائق لنماذج اللغة الكبيرة والوكلاء الأذكياء، وقد أصدرتها جوجل ديب مايند في عام 2025. وتشمل الأبحاث ذات الصلة ما يلي... DeepSearchQA: سد فجوة الشمولية لوكلاء البحث المتعمقالهدف هو تقييم قدرة النموذج على التخطيط، وقدرته على الحفاظ على السياق، واستخدامه الشامل لمعلومات الشبكة المفتوحة في مهام البحث عن المعلومات المعقدة ومتعددة الخطوات.
تحتوي هذه المجموعة من البيانات على 900 عينة تقييم مصممة يدويًا تغطي 17 مجالًا مختلفًا. تتكون كل عينة من سؤال، وفئة مجال السؤال المقابلة، وإجابة نموذجية للتقييم، وتصنيف لنوع الإجابة. تُصنف أنواع الإجابات إلى إجابات فردية وإجابات جماعية، مع ما يقارب 651 سؤالًا من نوع TP3T تتطلب من النموذج تقديم مجموعة كاملة من الإجابات. صُممت جميع الأسئلة بصيغة "سلسلة سببية"، ما يعني أن استرجاع المعلومات اللاحق يعتمد على نتائج البحث في الخطوات السابقة، الأمر الذي يتطلب من النموذج تنفيذ خطط بحث متعددة الخطوات والحفاظ على اتساق سياقي طويل الأمد. تستند جميع المهام إلى شبكات مفتوحة، ما يضمن إجابات موضوعية وقابلة للتحقق. تُستخدم هذه المجموعة بشكل أساسي لتقييم نماذج اللغة الكبيرة أو أنظمة الوكلاء الأذكياء ذات إمكانيات البحث الشبكي.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.