HyperAIHyperAI
il y a 11 jours

UDRN : Réseau neuronal de réduction dimensionnelle unifié pour la sélection de caractéristiques et la projection de caractéristiques

Zelin Zang, Yongjie Xu, Linyan Lu, Yulan Geng, Senqiao Yang, Stan Z. Li
UDRN : Réseau neuronal de réduction dimensionnelle unifié pour la sélection de caractéristiques et la projection de caractéristiques
Résumé

La réduction de dimension (DR) consiste à projeter des données de haute dimension dans un espace latent de dimension réduite, tout en minimisant un objectif d'optimisation prédéfini. Les méthodes de DR se divisent généralement en sélection de caractéristiques (FS) et projection de caractéristiques (FP). La FS se concentre sur la sélection d’un sous-ensemble critique de dimensions, mais comporte le risque de déformer la distribution des données (sa structure). À l’inverse, la FP combine toutes les caractéristiques d’entrée dans un espace de dimension inférieure, dans le but de préserver la structure des données ; toutefois, elle souffre d’un manque d’interprétabilité et de sparsité. Traditionnellement, la FS et la FP constituent des catégories incompatibles, ce qui empêche leur unification dans un cadre cohérent. Nous proposons qu’une approche idéale de DR doive intégrer simultanément la FS et la FP dans un cadre unifié d’apprentissage de variétés en boucle fermée (end-to-end), permettant à la fois la découverte fondamentale de caractéristiques et la conservation des relations intrinsèques entre les échantillons de données dans l’espace latent. Dans ce travail, nous développons un cadre unifié, nommé Réseau de neurones pour la Réduction Unifiée de Dimension (UDRN), qui intègre la FS et la FP de manière compatible et end-to-end. Nous améliorons la structure du réseau de neurones en traitant séparément les tâches de FS et de FP à l’aide de deux sous-réseaux empilés. En outre, nous avons conçu une augmentation de données spécifique au processus de DR afin d’améliorer la capacité de généralisation de la méthode face à des jeux de données à très grande dimension, ainsi que des fonctions de perte compatibles avec cette augmentation. Des expérimentations étendues sur quatre jeux de données d’images et quatre jeux de données biologiques, incluant des données de très haute dimension, démontrent les avantages du UDRN par rapport aux méthodes existantes (FS, FP et pipelines FS&FP), notamment dans des tâches ultérieures telles que la classification et la visualisation.

UDRN : Réseau neuronal de réduction dimensionnelle unifié pour la sélection de caractéristiques et la projection de caractéristiques | Articles de recherche récents | HyperAI