
摘要
一种流行的多选题问答(MCQA)范式是采用文本到文本(text-to-text)框架。通过将不同任务的数据统一转化为单一的文本到文本格式,该方法训练一个生成式编码器-解码器模型,兼具强大性能与通用性。然而,将生成目标强行适配多选题分类性质的做法,导致解码器能力及可解码知识的利用率不足。为充分挖掘预训练编码器-解码器模型的生成能力及其蕴含的深层知识,本文提出一种增强生成能力的多选题问答模型——GenMC。该模型首先从问题中生成一个提示线索(clue),随后利用该线索增强阅读理解模块以完成MCQA任务。实验结果表明,GenMC在多个MCQA数据集上均优于传统的文本到文本模型。