Vous n’apprenez qu’une seule représentation : réseau unifié pour plusieurs tâches

Les êtres humains « comprennent » le monde à travers la vision, l’audition, le toucher, ainsi que par l’expérience passée. L’expérience humaine peut être acquise par apprentissage explicite (que nous appelons connaissance explicite) ou de manière inconsciente (que nous appelons connaissance implicite). Ces expériences, qu’elles soient acquises par apprentissage normal ou de façon inconsciente, sont codées et stockées dans le cerveau. En s’appuyant sur cette base de données riche et étendue d’expériences, les êtres humains parviennent à traiter efficacement des données, même lorsqu’elles n’ont jamais été vues auparavant. Dans cet article, nous proposons un réseau unifié capable d’encoder à la fois la connaissance implicite et la connaissance explicite, de manière similaire au fonctionnement du cerveau humain, qui apprend à la fois par des processus conscients et inconscients. Ce réseau unifié génère une représentation unifiée pouvant servir simultanément à diverses tâches. Nous pouvons ainsi réaliser l’alignement dans l’espace noyau, le raffinement de prédictions et l’apprentissage multi-tâches au sein d’un réseau neuronal convolutif. Les résultats montrent qu’en intégrant la connaissance implicite dans le réseau neuronal, les performances de toutes les tâches s’en trouvent améliorées. Nous analysons également plus en profondeur la représentation implicite apprise par le réseau unifié proposé, et celle-ci démontre une forte capacité à capturer le sens physique associé à différentes tâches. Le code source de ce travail est disponible à l’adresse suivante : https://github.com/WongKinYiu/yolor.