2ヶ月前

科学を簡易化する:一般向けの科学文献要約用コーパス

Tomas Goldsack; Zhihao Zhang; Chenghua Lin; Carolina Scarton
科学を簡易化する:一般向けの科学文献要約用コーパス
要約

一般化要約の目的は、与えられたテキストを要約するとともに簡素化することにより、その内容を非専門家にもより理解しやすくすることです。一般化要約の自動手法は、科学文献へのアクセスを拡大し、研究結果に関する異分野間の知識共有や公衆の理解度を向上させる上で大きな価値を提供できます。しかし、このタスク向けの現在のコーパスは規模と範囲が限られており、広く適用可能なデータ駆動型アプローチの開発を妨げています。これらの問題を解決するために、私たちは2つの新しい一般化要約データセット、PLOS(大規模)とeLife(中規模)を紹介します。これらには、それぞれ医学生物学ジャーナル記事と専門家によって書かれた一般向け要約が含まれています。私たちはこれらの一般向け要約について詳細な特性分析を行い、データセット間で異なる読みやすさや抽象度について指摘しています。これは異なるアプリケーションのニーズに対応するための有用な情報となります。最後に、主流の要約手法を使用してデータセットのベンチマークを行い、領域専門家による手動評価も実施しました。これにより、データセットの有用性が示されるとともに、このタスクにおける主要な課題が明らかになりました。

科学を簡易化する:一般向けの科学文献要約用コーパス | 最新論文 | HyperAI超神経