Réseaux neuronaux de type Siamese pour la reconnaissance d’images à une seule image

Le processus d’apprentissage de bonnes caractéristiques pour les applications d’apprentissage automatique peut être très coûteux en termes de ressources computationnelles et s’avérer difficile dans les cas où les données disponibles sont limitées. Un exemple typique de cette situation est le cadre d’apprentissage à une seule instance (one-shot learning), dans lequel il faut effectuer des prédictions correctes à partir d’un seul exemple par nouvelle classe. Dans cet article, nous explorons une méthode pour apprendre des réseaux neuronaux jumeaux (siamese neural networks) qui reposent sur une architecture particulière permettant de classer naturellement la similarité entre les entrées. Une fois le réseau ajusté, nous pouvons exploiter des caractéristiques discriminatives puissantes afin de généraliser la capacité prédictive du réseau non seulement à de nouvelles données, mais aussi à des classes entièrement nouvelles provenant de distributions inconnues. En utilisant une architecture convolutive, nous obtenons des résultats remarquables, dépassant ceux des autres modèles d’apprentissage profond et atteignant une performance quasi-état-de-l’art sur des tâches de classification à une seule instance.