DuReader、大規模なオープンドメインの中国語機械読解データセット

DuReader は、機械読解用の大規模なオープンドメインの中国語データセットであり、機械読解モデルおよびシステムのトレーニングまたは評価に使用できます。
データセットは、200,000 の質問、420,000 の回答、100 万のドキュメントで構成されています。質問とドキュメントは Baidu Search と Baidu Know に基づいており、回答は手動で生成されます。データセットは質問タイプの注釈も提供し、各質問にはエンティティ、説明、はいいいえ、事実、または意見の分類が手動で注釈付けされます。
DuReader.torrent
シーディング 1ダウンロード中 1ダウンロード完了 324総ダウンロード数 608