11 天前

MedTSS:通过语言学分析与概念强化实现科学文献的抽象摘要生成

{Dr. Hammad Naveed, Dr. Nadia Saeed}
摘要

本研究针对预训练模型(Pretrained Models, PTMs)在生成科学文献——尤其是医学研究文献——准确且全面的摘要时存在的局限性,提出了一种名为医学文本简化与摘要(Medical Text Simplification and Summarization, MedTSS)的解决方案。该方案引入了一个专用模块,旨在增强PTMs的输入文本质量。MedTSS有效缓解了令牌(token)长度限制问题,强化了多个关键概念的表达,并在无需额外训练的前提下显著降低了实体幻觉(entity hallucination)现象。此外,该模块还进行语言学分析,对生成的摘要进行简化处理,特别适配医学研究文献所特有的复杂性与专业性。实验结果表明,MedTSS在不依赖额外训练的情况下,将Rouge-1得分从16.46提升至35.17,实现了显著性能提升。该框架强调知识驱动的组件设计,提出了与“更多数据”或“更多参数”这一主流观点相异的全新视角。这一替代性方法在健康相关领域具有重要应用价值,对自然语言处理(NLP)领域具有更广泛的贡献意义。MedTSS不仅有效应对了医学研究文献摘要生成中的复杂挑战,更标志着一种范式转变,其影响可延伸至超出初始应用场景的多个领域。

MedTSS:通过语言学分析与概念强化实现科学文献的抽象摘要生成 | 最新论文 | HyperAI超神经