Un classificateur probabiliste explicite pour des données catégorielles inspiré de la physique quantique

Cet article présente le Sparse Tensor Classifier (STC), un algorithme supervisé de classification destiné aux données catégorielles, inspiré du concept de superposition d’états en physique quantique. En considérant une observation comme une superposition de caractéristiques, nous introduisons le concept de dualité onde-particule dans l’apprentissage automatique et proposons un cadre généralisé unifiant les probabilités classiques et quantiques. Nous démontrons que le STC possède un large éventail de propriétés souhaitables, rares dans la plupart des autres méthodes d’apprentissage automatique, tout en restant exceptionnellement facile à comprendre et à mettre en œuvre. Une évaluation empirique du STC sur des données structurées et pour la classification de texte montre que notre méthode atteint des performances de pointe par rapport à des classificateurs standards ainsi qu’aux réseaux de neurones profonds, avec en plus l’avantage de nécessiter très peu de prétraitement des données et d’ajustement de hyperparamètres. En outre, le STC fournit une explication native de ses prédictions, tant pour des instances individuelles que globalement pour chaque étiquette cible.