日付

6ヶ月前

データセット構成

論文URL

LuMGoG6lBA

ライセンス

Apache 2.0

タグ

LLM

自然言語処理

検索拡張生成

SSRBは、ハルビン工業大学（深圳）が香港理工大学、清華大学などの研究機関と共同で2025年に公開した、半構造化データに対する自然言語クエリのための大規模ベンチマークデータセットです。関連研究論文には以下が含まれます… SSRB: 大規模な異種半構造化データへの直接自然言語クエリこのモデルは、複雑な自然言語クエリ条件下で半構造化データを取得するモデルの能力を評価および促進することを目的とした NeurIPS 2025 データセットおよびベンチマークに選定されました。このデータセットには、約1,400万個の半構造化データオブジェクトと8,485個のテストクエリが含まれており、6つの異なるドメインをカバーし、99の異なるパターンが含まれています。データセット内の各クエリは、半構造化データの検索要件に対応しています。クエリ条件は通常、正確なフィールド一致制約とあいまいなセマンティック一致要件を組み合わせ、複数のフィールドや暗黙的な推論が含まれる場合があります。これは、複雑なクエリ条件下で半構造化データを取得および理解するモデルの能力を体系的に評価するために使用されます。

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

Discordで議論

日付

6ヶ月前

データセット構成

論文URL

LuMGoG6lBA

ライセンス

Apache 2.0

タグ

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

SSRB 半構造化データ自然言語クエリデータセット

AIでAIを構築

HyperAI Newsletters

Command Palette

SSRB 半構造化データ自然言語クエリデータセット

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

ToolACE 複合ツール学習対話データセット

CHIMERA一般推論合成データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

CCTV事故転倒検知データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

SSRB 半構造化データ自然言語クエリデータセット

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

ToolACE 複合ツール学習対話データセット

CHIMERA一般推論合成データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

CCTV事故転倒検知データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

ToolACE 複合ツール学習対話データセット

CHIMERA一般推論合成データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

CCTV事故転倒検知データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

ToolACE 複合ツール学習対話データセット

CHIMERA一般推論合成データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

CCTV事故転倒検知データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

RoVid-X ロボットビデオ生成データセット

RoVid-X ロボットビデオ生成データセット

RoVid-X ロボットビデオ生成データセット

RoVid-X ロボットビデオ生成データセット