16日前

ロシア語ニュースの自動要約用データセット

Ilya Gusev
ロシア語ニュースの自動要約用データセット
要約

自動テキスト要約は、さまざまな分野や言語において研究されてきた。しかし、ロシア語についてはそのような状況にはない。この問題を解決するために、我々はロシア語ニュース要約のための最初のデータセット「Gazeta」を提示する。本データセットの特性を詳述し、いくつかの抽出型および抽象型モデルのベンチマークを実施した。その結果、本データセットがロシア語テキスト要約手法にとって有効なタスクであることを示した。さらに、事前学習済みのmBARTモデルがロシア語要約において有用であることも実証した。

ロシア語ニュースの自動要約用データセット | 最新論文 | HyperAI超神経