Command Palette

Search for a command to run...

4ヶ月前

複雑-簡潔なテキストペアの明示的ラベルから簡潔化の仕方を学ぶ

{Carolina Scarton o Fern Alva-Manchego Lucia Specia Joachim Bingel Gustavo Paetzold}

複雑-簡潔なテキストペアの明示的ラベルから簡潔化の仕方を学ぶ

要約

現在のテキスト簡略化(Text Simplification: TS)に関する研究は、二つの中心的な課題によって妨げられている。第一に、高品質な並列簡略化データが極めて少ないこと、第二に、既存データに削除や置換といった簡略化操作の明示的なアノテーションが欠如していることである。最近導入されたNewselaコーパスにより、第一の課題は緩和されたものの、依然として簡略化は並列テキストからブラックボックス型のエンドツーエンドアプローチによって直接学習される必要があり、明示的なアノテーションからの学習は行われていない。このような複雑な文と簡略化された文の並列ペアは、しばしば極めて大きな違いを示すため、一般化が困難となる。また、エンドツーエンドモデルでは、データから実際に学習された内容の解釈が困難となる。本研究では、TSのタスクをその下位問題に分解する手法を提案する。まず、並列コーパス内における簡略化操作を自動的に同定する方法を設計し、これらのアノテーションに基づいたシーケンスラベリングアプローチを導入する。最後に、異なるアプローチがどのような変換をモデル化できるかに関する洞察を提供する。

ベンチマーク

ベンチマーク方法論指標
text-simplification-on-newselaSeqLabel
SARI: 29.53*
text-simplification-on-pwkp-wikismallSeqLabel
SARI: 30.50*
text-simplification-on-turkcorpusSeqLabel
SARI (EASSEu003e=0.2.1): 37.08*

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
複雑-簡潔なテキストペアの明示的ラベルから簡潔化の仕方を学ぶ | 論文 | HyperAI超神経