HyperAI
Command Palette
Search for a command to run...
LongCite-45k 大規模モデルのきめ細かいブースト データセット
LongCite-45k は、長文質問応答タスクにおける大規模言語モデル (LLM) の信頼性と検証可能性を向上させることを目的として、2024 年に清華大学によって開始されたオープンソース データ セットです。関連する論文結果は「LongCite: LLM がロングコンテキスト QA で詳細な引用を生成できるようにする”。
このデータ セットには、文レベルの参照を含む 44,600 の高品質な質問と回答のデータが含まれており、最大 128,000 トークンの長文処理をサポートし、ユーザーはきめ細かい文レベルの参照を生成することで模範解答の精度を検証できます。

LongCite-45k.torrent
シーディング 1ダウンロード中 0完了 178総ダウンロード数 252
このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。