DFM : Correspondance par flux dual sans interpolation

Les flows normalisants continus (CNF) permettent de modéliser des distributions de données grâce à des architectures infiniment longues expressives. Toutefois, ce type de modélisation repose sur un processus computationnelment coûteux, consistant à résoudre une équation différentielle ordinaire (ODE) pendant l’entraînement par vraisemblance maximale. Le cadre récemment proposé, appelé flow matching (FM), permet de simplifier considérablement la phase d’entraînement en utilisant une fonction de perte de régression basée sur un champ de vecteurs interpolé. Dans cet article, nous proposons une approche sans interpolation, appelée flow matching dual (DFM), qui ne repose pas sur d’hypothèses explicites concernant le champ de vecteurs modélisé. Le DFM optimise à la fois un modèle de champ de vecteurs direct et un champ de vecteurs inverse, grâce à une nouvelle fonction de perte qui favorise la bijectivité des transformations directe et inverse. Nos expériences sur la détection d’anomalies non supervisée avec le jeu de données SMAP montrent que le DFM présente des avantages par rapport aux CNF entraînés selon les critères de vraisemblance maximale ou de flow matching, atteignant ainsi des performances au niveau de l’état de l’art.