HyperAIHyperAI

Command Palette

Search for a command to run...

DeepSearchQA マルチステップ情報検索質問応答データセット

Date

1日前

Organization

グーグル

Publish URL

www.kaggle.com

Paper URL

DeepSearchQA

License

Apache 2.0

DeepSearchQA は、Google DeepMind が 2025 年にリリースした、大規模言語モデルとインテリジェント エージェント向けの情報検索および事実評価データセットです。関連する研究論文には以下が含まれます... DeepSearchQA: ディープリサーチエージェントの包括性ギャップを埋める目的は、複雑な多段階の情報検索タスクにおけるモデルの計画能力、コンテキスト保存能力、およびオープンネットワーク情報の総合的な活用を評価することです。

このデータセットには、17の異なるドメインをカバーする900個の手動設計評価サンプルが含まれています。各サンプルは、質問プロンプト、対応するドメインカテゴリ、評価のための標準回答、および回答タイプラベルで構成されています。回答タイプは、単一回答とセット回答に区別されます。約65%の質問では、モデルが完全な回答セットを提供することが求められます。すべての質問は「因果連鎖」形式で設計されており、後続の情報検索は前のステップの検索結果に依存するため、モデルは複数ステップの検索プランを実行し、長期的な文脈の一貫性を維持する必要があります。すべてのタスクはオープンネットワークに基づいており、客観的で検証可能な回答を保証します。このデータセットは主に、大規模言語モデルやネットワーク検索機能を備えたインテリジェントエージェントシステムを評価するために使用されます。

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています