
摘要
我们开展了法语生物医学文本简化任务的实验研究。实验采用两类语料:一是从现有的法语健康领域可比语料库中提取的平行句对,二是将英文WikiLarge语料库翻译成法语所得的平行语料;同时,我们还构建了一个词典,用于关联医学术语与其对应的同义表达。在此基础上,我们利用不同比例的通用语句与专业语句对神经网络模型进行训练。通过BLEU、SARI和Kandel等指标对模型结果进行评估。实验结果表明,即使少量专业领域数据的引入,也能显著提升文本简化效果。
我们开展了法语生物医学文本简化任务的实验研究。实验采用两类语料:一是从现有的法语健康领域可比语料库中提取的平行句对,二是将英文WikiLarge语料库翻译成法语所得的平行语料;同时,我们还构建了一个词典,用于关联医学术语与其对应的同义表达。在此基础上,我们利用不同比例的通用语句与专业语句对神经网络模型进行训练。通过BLEU、SARI和Kandel等指标对模型结果进行评估。实验结果表明,即使少量专业领域数据的引入,也能显著提升文本简化效果。