DeepPatent : reconnaissance et recherche à grande échelle de dessins de brevets

Nous abordons le problème de l’analyse et de la récupération des dessins techniques. Premièrement, nous introduisons DeepPatent, un nouveau jeu de données à grande échelle dédié à la reconnaissance et à la récupération des dessins de brevets d’invention. Ce jeu de données propose plus de 350 000 dessins de brevets d’invention, destinés à la récupération d’images. Contrairement aux jeux de données existants, DeepPatent fournit des associations de récupération d’images à très fine granularité au sein de la collection de dessins, sans s’appuyer sur des associations inter-domaines pour la supervision. Nous avons développé un modèle de base basé sur l’apprentissage profond, nommé Patent-Net, fondé sur les meilleures pratiques d’entraînement des modèles de récupération d’images statiques. Nous démontrons que Patent-Net, entraîné sur nos associations à fine granularité issues de DeepPatent, présente des performances supérieures par rapport à d’autres approches d’apprentissage profond ainsi qu’à des descripteurs classiques de vision par ordinateur. Grâce à l’introduction de ce nouveau jeu de données et d’algorithmes de référence, nous montrons que l’analyse et la récupération des dessins techniques constituent encore un défi ouvert en vision par ordinateur, et que la récupération des dessins de brevets offre un banc d’essai réaliste pour stimuler la recherche dans ce domaine.