Vers une extraction automatique de diagrammes de classes UML à partir de spécifications en langage naturel

Dans le cadre de l’ingénierie pilotée par les modèles (MDE), les diagrammes de classes UML constituent un moyen efficace de planifier et de communiquer entre développeurs. Toutefois, leur création manuelle s’avère complexe et coûteuse en ressources. Nous proposons une approche automatisée pour extraire des diagrammes de classes UML à partir de spécifications logicielles rédigées en langage naturel. Pour concevoir notre méthode, nous avons constitué un jeu de données comprenant des diagrammes de classes UML accompagnés de leurs spécifications en anglais, avec l’aide de bénévoles. Notre approche repose sur une chaîne de traitements composée de plusieurs étapes : segmentation du texte d’entrée en phrases, classification de ces phrases, génération de fragments de diagrammes de classes UML à partir des phrases, puis composition de ces fragments pour former un diagramme UML global. Nous avons également développé un cadre d’évaluation quantitatif spécifique à l’extraction de diagrammes de classes UML. Bien que notre approche obtienne des taux de précision et de rappel faibles, elle constitue une référence (benchmark) utile pour les recherches futures dans ce domaine.