日付

6ヶ月前

ライセンス

Apache 2.0

タグ

LongBench-Proは、長文文脈言語モデルを評価するために2025年にリリースされたデータセットです。このデータセットは、異なるコンテキストの長さ、タスクの種類、動作条件下における長文テキストの理解と処理におけるモデルの能力を体系的に評価することを目的としています。このデータセットには、レベル1タスク11件とレベル2タスク25件を含む1,500件のサンプルが含まれています。タスクは、コンテキストの使用頻度に基づいて、フルコンテキストタスクと部分コンテキストタスクに分類されます。英語と中国語の両方のサンプルが含まれており、英語と中国語のデータがバランスよく分散されています。タスクの難易度は、「簡単」、「中」、「難しい」、「最高」の4段階に分類されています。コンテキストの長さに関しては、サンプルは8kトークンから256kトークンまでの6つの長さの範囲をカバーし、均等に分散されています。

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

Discordで議論

日付

6ヶ月前

ライセンス

Apache 2.0

タグ

自然言語処理

ベンチマーク

Sutra 10B 事前学習用教育・訓練データセット

2ヶ月前

肺がん臨床データセット

2ヶ月前

CL-bench コンテキスト学習評価ベンチマークデータセット

4ヶ月前

GroundingME 複雑シーン理解評価データセット

5ヶ月前

MCIFマルチモーダルクロスランゲージ指導データセット

5ヶ月前

TxT360-3efforts マルチタスク推論データセット

5ヶ月前

X線密輸品検出データセット

5ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

AIでAIを構築

HyperAI Newsletters

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

肺がん臨床データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

肺がん臨床データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

肺がん臨床データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

肺がん臨床データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

Command Palette

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

LongBench-Pro ロングコンテキスト包括的評価データセット

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

肺がん臨床データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

LongBench-Pro ロングコンテキスト包括的評価データセット

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

肺がん臨床データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

肺がん臨床データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

肺がん臨床データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

X線密輸品検出データセット