12日前

BART-IT:イタリア語テキスト要約のための効率的なシーケンス・トゥ・シーケンスモデル

{Cagliero Luca, La Quatra Moreno}
要約

注目機構を備えたアーキテクチャの登場により、テキスト要約におけるニューラルシーケンス・トゥ・シーケンスモデルの性能は著しく向上しました。これらのモデルは英語文書の要約において有効であることが実証されていますが、他の言語への移植性は限定的であり、依然として改善の余地が広く残されています。本論文では、イタリア語に特化して設計されたシーケンス・トゥ・シーケンスモデル「BART-IT」を提案します。このモデルは、イタリア語特有の言語特性を学習するため、大規模なイタリア語テキストコーパス上で事前学習され、その後、要約要約(抽象的要約)に用いられる複数のベンチマークデータセット上で微調整されています。実験の結果、パラメータ数が著しく少ないにもかかわらず、ROUGEスコアにおいて他の最先端モデルを上回ることが確認されました。BART-ITの活用は、イタリア語向けの革新的な自然言語処理(NLP)アプリケーションの開発を促進するものと期待されます。本研究では、モデルを研究コミュニティに公開することでさらなる研究と応用を促進するだけでなく、抽象的要約モデルの利用に伴う倫理的課題についても議論を展開しています。

BART-IT:イタリア語テキスト要約のための効率的なシーケンス・トゥ・シーケンスモデル | 最新論文 | HyperAI超神経