Premier système automatique de reconnaissance vocale continue en fongbe : développement de modèles acoustiques et de modèles linguistiques
Ce papier présente nos efforts visant à développer un système de reconnaissance automatique de la parole (ASR) pour une langue sous-ressourcée récemment identifiée (le Fongbe). L’objectif de ce travail consiste à concevoir des modèles acoustiques et des modèles linguistiques destinés à une décodage continu de la parole en fongbe. Le principal défi lié au fongbe — une langue africaine parlée principalement au Bénin, au Togo et au Nigéria — réside dans l’absence totale de ressources linguistiques disponibles pour le développement d’un système ASR. Dans le cadre de cette étude, nous avons tout d’abord collecté des corpus textuels et parlés en fongbe, dont la description est présentée dans les sections suivantes. Le modèle acoustique a été construit au niveau graphémique, tandis que deux modèles linguistiques ont été développés afin de permettre une comparaison des performances. Nous avons également réalisé une simplification des voyelles en supprimant les diacritiques tonals, afin d’évaluer leur impact sur la qualité des modèles linguistiques.