
要約
自動テキスト要約は、さまざまな分野や言語において研究されてきた。しかし、ロシア語についてはそのような状況にはない。この問題を解決するために、我々はロシア語ニュース要約のための最初のデータセット「Gazeta」を提示する。本データセットの特性を詳述し、いくつかの抽出型および抽象型モデルのベンチマークを実施した。その結果、本データセットがロシア語テキスト要約手法にとって有効なタスクであることを示した。さらに、事前学習済みのmBARTモデルがロシア語要約において有用であることも実証した。
自動テキスト要約は、さまざまな分野や言語において研究されてきた。しかし、ロシア語についてはそのような状況にはない。この問題を解決するために、我々はロシア語ニュース要約のための最初のデータセット「Gazeta」を提示する。本データセットの特性を詳述し、いくつかの抽出型および抽象型モデルのベンチマークを実施した。その結果、本データセットがロシア語テキスト要約手法にとって有効なタスクであることを示した。さらに、事前学習済みのmBARTモデルがロシア語要約において有用であることも実証した。