HyperAIHyperAI

Command Palette

Search for a command to run...

LCSTS: 大規模中国語短文要約データセット

Baotian Hu; Qingcai Chen; Fangze Zhu

概要

自動的なテキスト要約は、大規模なテキスト要約データセットの不足により部分的に難易度が高いと広く認識されています。全文の要約を大規模に構築する際の大きな課題に対応するため、本論文では中国のマイクロブログサイト「新浪微博(Sina Weibo)」から収集した中国語短文要約データセットの大規模コーパスを紹介します。このコーパスは、各テキストの著者によって提供された200万件以上の実際の中国語短文とその短い要約から構成されており、公的に公開されています(http://icrc.hitsz.edu.cn/Article/show/139.html)。さらに、10,666件の短い要約とそれに対応する短文との関連性を手動でタグ付けしました。このコーパスに基づいて、我々は再帰型ニューラルネットワークを用いた要約生成手法を導入し、有望な結果を得ました。これは、提案されたコーパスが短文要約研究において有用であることを示すだけでなく、このトピックに関する今後の研究における基準も提供しています


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
LCSTS: 大規模中国語短文要約データセット | 記事 | HyperAI超神経