
摘要
近年来,高质量、大规模英文语料资源的进展推动了英语自动文本简化(Automatic Text Simplification, ATS)研究的前沿发展。然而,由于缺乏涵盖多种语言中复杂句—简单句配对的多样化评估基准,多语言文本简化研究仍相对不足。本文提出了MultiSim基准,该基准包含12种不同语言的27个资源,涵盖超过170万对复杂句—简单句,旨在促进更高效多语言文本简化模型及评估指标的研发。我们利用预训练多语言语言模型在MultiSim上的实验表明,在非英语语境下,多语言训练带来了显著的性能提升。尤其值得注意的是,俄语在零样本跨语言迁移至低资源语言时表现出强劲性能。此外,我们进一步证明,使用BLOOM-176b进行少量样本提示(few-shot prompting)即可达到与参考简化文本相当的质量,在大多数语言中甚至优于微调模型。上述发现已通过人工评估得到验证。