Command Palette
Search for a command to run...
AnonyRAG 古典小説質問応答データセット
※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください。
AnonyRAGは、テンセントYoutuラボ、モナッシュ大学、香港理工大学によって2025年にリリースされたエンティティ匿名化タスクのための質問応答データセットです。関連する論文の結果は次のとおりです。Youtu-GraphRAG: グラフ検索と複雑推論を拡張する垂直統合エージェント」は、エンティティが匿名化されている場合に、検索拡張生成 (RAG) システムが証拠を取得するために検索に依存しているかどうかを評価することを目的としています。
このデータセットは、『水滸伝』『紅楼夢』『白鯨』『ミドルマーチ』という4つの古典小説から抽出されています。質問と回答のペアとテキストスニペットの両方を網羅し、中国語と英語の両方で利用可能です。質問と回答部分には約1,397の質問が含まれており、一般的な質問と回答、多肢選択式質問、エンティティ匿名化回復タスクなどがあり、質問は単純なものと複雑なものに分類されています。テキスト部分には、質問応答タスクをサポートするための検索コーパスとしてテキスト段落が提供されています。RAGモデルの評価、複雑なマルチホップ推論の研究、知識質問応答システムの開発、エンティティ匿名化および回復タスクに適しています。