HyperAI

Hors Distribution

La détection hors distribution (OOD) est une direction de recherche clé dans le domaine de l'apprentissage automatique, qui se concentre sur l'identification d'échantillons de données qui ne sont pas couverts pendant la phase de formation du modèle. De telles techniques de détection sont essentielles pour améliorer la robustesse des modèles, en particulier lorsque ceux-ci peuvent rencontrer de nouveaux environnements qui diffèrent considérablement des données de formation. Le principal défi de la détection OOD est que le modèle doit être capable de réagir correctement lorsqu’il est confronté à des données inconnues ou anormales, plutôt que de faire des prédictions à l’aveugle. Ces échantillons inconnus peuvent provenir de distributions complètement différentes ou avoir des caractéristiques différentes des données d’entraînement, ce qui nécessite que le modèle ait une certaine capacité de généralisation.

Dans les applications réelles, la détection OOD a un large éventail de scénarios d'application, y compris, mais sans s'y limiter, le diagnostic médical, l'évaluation des risques financiers, la conduite autonome, etc. Dans ces domaines, les décisions du modèle peuvent avoir des conséquences importantes, il devient donc particulièrement important de pouvoir identifier et gérer avec précision les échantillons OOD. Par exemple, dans le diagnostic médical, le modèle peut rencontrer des cas rares qui peuvent ne jamais apparaître dans les données de formation, et le fait de ne pas identifier correctement ces échantillons OOD peut conduire à un diagnostic incorrect.

L'Université Jiao Tong de Shanghai et le laboratoire Alibaba Tongyi ont publié un article en 2024 intitulé «Incorporation de trajectoires pour la détection hors distribution dans le raisonnement mathématique", qui a été accepté par NeurIPS 2024, est le premier résultat de recherche sur la détection hors distribution dans les scénarios de raisonnement mathématique.