HyperAI

このデータセットを使用 Discordで議論

日付

1ヶ月前

ライセンス

CC BY-SA 4.0

タグ

LongBlocksは、リスボン大学、電気通信研究所、TransPerfect、およびその他の機関によって2026年に公開された、長文コンテキストの多言語合成データセットです。このデータセットには、書籍、ウェブページのテキスト、Wikipedia、arXiv論文、プログラミングコード、コミュニティの質疑応答など、長文の文書コーパスを網羅した、約194,000件の長文の質疑応答例が含まれています。

データフィールド:

id: 文字列、一意のインスタンス識別子（制限付き書籍データの復元にのみ使用。その他のソースの場合は null）。
document: 文字列、長いソースドキュメントの内容（書籍データが限られている場合は null）。
source: 文字列、ソースコーパスの名前。
language: 例で使用されている言語またはプログラミング言語を表す文字列。
質問：文字列合成、長いコンテキストの問題。
回答：文字列。信憑性を確認するためにフィルタリングされた参照回答です。
response_Qwen3-Next-80B-A3B / response_Qwen3.5-27B / response_Nemotron-3-Nano-30B-A3B: 教師モデルによって生成された応答に対応する文字列。

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用 Discordで議論

日付

1ヶ月前

ライセンス

CC BY-SA 4.0

タグ

データフィールド:

id: 文字列、一意のインスタンス識別子（制限付き書籍データの復元にのみ使用。その他のソースの場合は null）。
document: 文字列、長いソースドキュメントの内容（書籍データが限られている場合は null）。
source: 文字列、ソースコーパスの名前。
language: 例で使用されている言語またはプログラミング言語を表す文字列。
質問：文字列合成、長いコンテキストの問題。
回答：文字列。信憑性を確認するためにフィルタリングされた参照回答です。
response_Qwen3-Next-80B-A3B / response_Qwen3.5-27B / response_Nemotron-3-Nano-30B-A3B: 教師モデルによって生成された応答に対応する文字列。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

LongBlocks 長文コンテキスト多言語質問応答データセット

データフィールド:

AIでAIを構築

HyperAI Newsletters

Command Palette

LongBlocks 長文コンテキスト多言語質問応答データセット

データフィールド:

関連データセット

ViMUビデオメタファー理解データセット

VisCoR-55K ビジュアル推論データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

長距離山火事・煙検知データセット

QCalEval 量子較正グラフの理解データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

PanScaleリモートセンシングPancolorシャープニングデータセット

ParseBench文書解析能力評価データセット

感情プローブ感情検出データセット

MIA多段階推論および決定軌跡データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

MDPBench 多言語文書解析ベンチマークデータセット

GPT-5.4ステップバイステップ推論データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

LongBlocks 長文コンテキスト多言語質問応答データセット

データフィールド:

関連データセット

ViMUビデオメタファー理解データセット

VisCoR-55K ビジュアル推論データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

長距離山火事・煙検知データセット

QCalEval 量子較正グラフの理解データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

PanScaleリモートセンシングPancolorシャープニングデータセット

ParseBench文書解析能力評価データセット

感情プローブ感情検出データセット

MIA多段階推論および決定軌跡データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

MDPBench 多言語文書解析ベンチマークデータセット

GPT-5.4ステップバイステップ推論データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

ViMUビデオメタファー理解データセット

VisCoR-55K ビジュアル推論データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

長距離山火事・煙検知データセット

QCalEval 量子較正グラフの理解データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

PanScaleリモートセンシングPancolorシャープニングデータセット

ParseBench文書解析能力評価データセット

感情プローブ感情検出データセット

MIA多段階推論および決定軌跡データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

MDPBench 多言語文書解析ベンチマークデータセット

GPT-5.4ステップバイステップ推論データセット

関連データセット

ViMUビデオメタファー理解データセット

VisCoR-55K ビジュアル推論データセット

MathNetマルチモーダル数学ベンチマーク推論データセット

Claw-Eval実世界ベンチマークデータセット

眼底疾患分類データセット

長距離山火事・煙検知データセット

QCalEval 量子較正グラフの理解データセット

RSRCCリモートセンシング領域変化理解ベンチマークデータセット

PanScaleリモートセンシングPancolorシャープニングデータセット

ParseBench文書解析能力評価データセット

感情プローブ感情検出データセット

MIA多段階推論および決定軌跡データセット

OmniParsingBench マルチモーダル構文解析機能評価データセット

MDPBench 多言語文書解析ベンチマークデータセット

GPT-5.4ステップバイステップ推論データセット