Command Palette
Search for a command to run...
DeepSearchQA マルチステップ情報検索質問応答データセット
Date
Publish URL
Paper URL
License
Apache 2.0
DeepSearchQA は、Google DeepMind が 2025 年にリリースした、大規模言語モデルとインテリジェント エージェント向けの情報検索および事実評価データセットです。関連する研究論文には以下が含まれます... DeepSearchQA: ディープリサーチエージェントの包括性ギャップを埋める目的は、複雑な多段階の情報検索タスクにおけるモデルの計画能力、コンテキスト保存能力、およびオープンネットワーク情報の総合的な活用を評価することです。
このデータセットには、17の異なるドメインをカバーする900個の手動設計評価サンプルが含まれています。各サンプルは、質問プロンプト、対応するドメインカテゴリ、評価のための標準回答、および回答タイプラベルで構成されています。回答タイプは、単一回答とセット回答に区別されます。約65%の質問では、モデルが完全な回答セットを提供することが求められます。すべての質問は「因果連鎖」形式で設計されており、後続の情報検索は前のステップの検索結果に依存するため、モデルは複数ステップの検索プランを実行し、長期的な文脈の一貫性を維持する必要があります。すべてのタスクはオープンネットワークに基づいており、客観的で検証可能な回答を保証します。このデータセットは主に、大規模言語モデルやネットワーク検索機能を備えたインテリジェントエージェントシステムを評価するために使用されます。
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.