HyperAIHyperAI

Command Palette

Search for a command to run...

BRIGHT テキスト検索ベンチマーク データセット

日付

2年前

サイズ

481.53 MB

データセット構成

University of Washington
The University of Hong Kong

Paper URL

arxiv.org

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください

このデータセットは、香港大学、プリンストン大学、ワシントン大学、Google Cloud AI Research によって 2024 年に開始された新しいテキスト検索ベンチマーク テストです。関連する論文結果は次のとおりです。BRIGHT: 推論中心の検索のための現実的かつ挑戦的なベンチマーク”。 BRIGHT は、関連するドキュメントを取得するために深い推論を必要とする初のテキスト検索ベンチマークです。研究チームは、さまざまなドメイン (StackExchange、LeetCode、数学コンテスト) から 1,385 件の実際のクエリを収集しました。これらはすべて実際の人間のデータに由来しています。チームは、これらのクエリを、StackExchange の回答にリンクされている Web ページと、数学オリンピックの質問にタグ付けされた定理と組み合わせました。 これは、複雑なクエリを処理する際の検索システムのパフォーマンスを評価し、挑戦するために特別に設計されています。これらのクエリには、キーワードの一致だけでなく、関連するドキュメントを特定するための深い推論機能も必要です。簡単に言えば、BRIGHT は、検索システムが表面のテキストだけでなく、クエリの背後にあるロジックとコンテキストを「理解」できるかどうかをテストします。たとえば、経済学者は、人間の活動が気候システムにどのような影響を与えるかについての文書を見つけたいと考えています。この問題は単にキーワードのマッチングに関するものではなく、人間の活動 (森林破壊や都市化など) と気候変動の関係を理解する必要があります。

BRIGHT.torrent
シーディング 1ダウンロード中 0完了 190総ダウンロード数 336
  • BRIGHT/
    • README.md
      2.15 KB
    • README.txt
      4.3 KB
      • data/
        • BRIGHT.zip
          481.53 MB

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています