HyperAIHyperAI
il y a 2 mois

Apprentissage discriminatif k-shot utilisant des modèles probabilistes

Matthias Bauer; Mateo Rojas-Carulla; Jakub Bartłomiej Świątkowski; Bernhard Schölkopf; Richard E. Turner
Apprentissage discriminatif k-shot utilisant des modèles probabilistes
Résumé

Ce document présente un cadre probabiliste pour la classification d'images en k-échantillons. L'objectif est de généraliser à partir d'une tâche de classification à grande échelle initiale vers une tâche distincte comprenant de nouvelles classes et un nombre limité d'exemples. Cette nouvelle approche ne se contente pas d'exploiter la représentation basée sur les caractéristiques apprise par un réseau neuronal à partir de la tâche initiale (transfert représentatif), mais elle utilise également des informations sur les classes (transfert conceptuel). Les informations conceptuelles sont encapsulées dans un modèle probabiliste pour les poids de la dernière couche du réseau neuronal, qui agit comme un a priori pour l'apprentissage probabiliste en k-échantillons. Nous montrons que même un modèle probabiliste simple atteint l'état de l'art sur un jeu de données standard pour l'apprentissage en k-échantillons avec une marge considérable. De plus, il est capable de modéliser précisément l'incertitude, conduisant à des classifieurs bien calibrés, et il est facilement extensible et flexible, contrairement à de nombreuses approches récentes en apprentissage en k-échantillons.