XBNet : Un Réseau de Neurones Extrêmement Boosté

Les réseaux de neurones ont fait preuve d'une grande robustesse dans le traitement de données non structurées telles que des images, du texte, des vidéos et de l'audio. Cependant, il a été observé que leurs performances ne sont pas à la hauteur pour les données tabulaires ; c'est pourquoi les modèles basés sur les arbres sont préférés dans ces scénarios. Un modèle populaire pour les données tabulaires est celui des arbres boostés (boosted trees), une méthode d'apprentissage automatique hautement efficace et largement utilisée, qui offre également une bonne interprétabilité par rapport aux réseaux de neurones. Dans cet article, nous décrivons une nouvelle architecture appelée XBNet, qui tente de combiner les modèles basés sur les arbres avec ceux des réseaux de neurones pour créer une architecture robuste formée en utilisant une nouvelle technique d'optimisation, le Boosted Gradient Descent for Tabular Data (BGT-D), ce qui améliore son interprétabilité et ses performances.