HyperAIHyperAI

Command Palette

Search for a command to run...

Console

SSRB 半構造化データ自然言語クエリデータセット

日付

14時間前

組織

ハルビン工業大学、深圳
香港理工大学
清華大学

論文URL

LuMGoG6lBA

ライセンス

Apache 2.0

SSRBは、ハルビン工業大学(深圳)が香港理工大学、清華大学などの研究機関と共同で2025年に公開した、半構造化データに対する自然言語クエリのための大規模ベンチマークデータセットです。関連研究論文には以下が含まれます… SSRB: 大規模な異種半構造化データへの直接自然言語クエリこのモデルは、複雑な自然言語クエリ条件下で半構造化データを取得するモデルの能力を評価および促進することを目的とした NeurIPS 2025 データセットおよびベンチマークに選定されました。

このデータセットには、約1,400万個の半構造化データオブジェクトと8,485個のテストクエリが含まれており、6つの異なるドメインをカバーし、99の異なるパターンが含まれています。データセット内の各クエリは、半構造化データの検索要件に対応しています。クエリ条件は通常、正確なフィールド一致制約とあいまいなセマンティック一致要件を組み合わせ、複数のフィールドや暗黙的な推論が含まれる場合があります。これは、複雑なクエリ条件下で半構造化データを取得および理解するモデルの能力を体系的に評価するために使用されます。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最適価格のGPUでAI開発を加速。

AI共同コーディング
すぐに利用可能な GPU
最適価格

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています