
摘要
在模型驱动工程(Model-Driven Engineering, MDE)中,UML类图被广泛用于开发者之间的系统规划与沟通。然而,手动构建UML类图过程复杂且资源消耗大。为此,我们提出一种从自然语言软件规格说明中自动提取UML类图的方法。为开发该方法,我们借助志愿者协助,构建了一个包含UML类图及其对应英文规格说明的数据集。所提出的方法采用多步骤流水线架构,包括:将输入文本分割为句子、对句子进行分类、根据句子生成UML类图片段,以及将这些片段组合成完整的UML类图。我们还设计了一个针对UML类图提取任务的定量测试框架。实验结果表明,该方法在精确率与召回率方面表现较低,但可作为未来研究的基准参考。