HyperAIHyperAI
il y a 17 jours

Le contexte du jeu de données d'appui compte pour les problèmes de Bongard

Nikhil Raghuraman, Adam W. Harley, Leonidas Guibas
Le contexte du jeu de données d'appui compte pour les problèmes de Bongard
Résumé

Les méthodes actuelles d'apprentissage automatique peinent à résoudre les problèmes de Bongard, une catégorie d'épreuves d'intelligence qui consiste à déduire un « concept » abstrait à partir d'un ensemble d'images positives et négatives servant de « support », puis à classifier si une nouvelle image de requête illustre ou non ce concept clé. Sur Bongard-HOI, un benchmark dédié aux problèmes de Bongard sur des images naturelles, la plupart des méthodes existantes atteignent au mieux 69 % de précision (le hasard étant à 50 %). Une faible précision est souvent imputée à l’incapacité des réseaux neuronaux à découvrir des règles symboliques analogues à celles des humains. Dans ce travail, nous soulignons qu’un problème bien plus simple, souvent négligé, réduit significativement la performance : la plupart des méthodes n’adaptent pas les caractéristiques d’image en tenant compte de l’information globale contenue dans l’ensemble de support, se basant au contraire uniquement sur les informations extraites individuellement des images de support. Ce point est critique, car le « concept clé » dans un problème de Bongard typique ne peut souvent être distingué qu’en combinant plusieurs exemples positifs et plusieurs exemples négatifs. Nous explorons des méthodes simples pour intégrer ce contexte global et montrons des gains substantiels par rapport aux approches antérieures, atteignant ainsi de nouvelles performances record sur Bongard-LOGO (75,3 %) et Bongard-HOI (76,4 %), comparativement à des méthodes utilisant des architectures visionnelles équivalentes et affichant une bonne performance initiale sur l’ensemble original des problèmes de Bongard (60,8 %).