テキスト単純化
テキスト簡素化は、自然言語処理のタスクの一つで、文章の語彙的難易度と文法的複雑さを減らしながら元の意味を保つことを目指します。これにより、読みやすさと理解性が向上します。このタスクには大きな社会的な価値があり、認知障害のある人、非ネイティブスピーカー、読み書きに困難がある子供たちが情報にアクセスしやすくなる効果があります。
TurkCorpus
Newsela
CRF Alignment + Transformer
ASSET
GPT-175B (15 SARI-selected examples, random ordering)
PWKP / WikiSmall
TST
DEplain-APA-doc
long-mBART (trained on DEplain-APA-doc)
DEplain-web-doc
EurekaAlert
MedTSS-BART (Without Training)
DEplain-APA-sent
DEplain-web-sent
WikiLargeFR
mT5 (fine-tuned on MULTI-SIM)
Wiki-Auto + Turk