HyperAI超神経

ZeroSearch 質問応答データセット

ダウンロードヘルプ

ZeroSearch は、外部検索なしで質問に直接答えることができるモデル機能の構築に重点を置いて、Alibaba Tongyi Lab が 2025 年にリリースした高品質の質問応答データセットです。関連する論文の結果は次のとおりです。ZeroSearch: 検索せずにLLMの検索能力を奨励する”。

データセットには約 170,000 件のサンプルが含まれており、科学的知識、歴史的出来事、映画やテレビのエンターテインメント、地理、人文科学などの複数の知識分野をカバーしています。このデータセットは、事実に関する質問、定義に関する質問、真偽に関する質問などをカバーしており、小規模および中規模の質問応答モデルのトレーニングに適しています。慎重に設計された質問と回答のペアを通じて、モデルの常識的な推論、事実の記憶、論理的推論機能を評価し、自然言語処理の分野に標準化されたトレーニングおよびテストのリソースを提供することを目的としています。