Adaptation de domaine des modèles de segmentation de mots thaïs utilisant un ensemble empilé

Comme de nombreuses tâches de traitement du langage naturel, la segmentation des mots en thaï est dépendante du domaine. Les chercheurs ont longtemps eu recours à l'apprentissage par transfert pour adapter un modèle existant à un nouveau domaine. Toutefois, cette approche n'est pas applicable dans les cas où l'on ne peut interagir qu'avec les couches d'entrée et de sortie des modèles, également appelés « boîtes noires ». Nous proposons une solution de filtrage et de raffinement fondée sur le paradigme d'apprentissage par ensemble empilé afin de surmonter cette limitation des boîtes noires. Nous avons mené des études expérimentales approfondies comparant notre méthode aux modèles de pointe et à l'apprentissage par transfert. Les résultats expérimentaux montrent que notre approche est une méthode efficace d'adaptation de domaine, offrant des performances comparables à celles de l'apprentissage par transfert.