Machines à facteurs conscientes de l'interaction pour les systèmes de recommandation

La Machine de Factorisation (FM) est une approche de apprentissage supervisé largement utilisée grâce à son efficacité dans la modélisation des interactions entre caractéristiques. Malgré le succès et l'application fructueuse de la FM et de ses nombreuses variantes basées sur l'apprentissage profond, traiter chaque interaction de caractéristique de manière équitable peut dégrader les performances. Par exemple, les interactions d'une caractéristique inutile peuvent introduire du bruit ; l'importance d'une caractéristique peut également varier lorsqu'elle interagit avec différentes caractéristiques.Dans cette étude, nous proposons un nouveau modèle nommé \emph{Machine de Factorisation Consciente des Interactions} (IFM) en introduisant un Mécanisme Conscient des Interactions (IAM). Ce mécanisme comprend deux aspects : l'\emph{aspect des caractéristiques} et l'\emph{aspect des domaines}. L'aspect des caractéristiques apprend l'importance des interactions entre caractéristiques à travers un réseau d'attention, tandis que l'aspect des domaines apprend l'effet des interactions entre caractéristiques comme une similarité paramétrique entre le vecteur d'interaction de caractéristique et le prototype d'interaction de domaine correspondant.L'IFM introduit un contrôle plus structuré et apprend l'importance des interactions entre caractéristiques de manière stratifiée, ce qui offre plus de flexibilité pour ajuster les interactions à la fois au niveau des caractéristiques et au niveau des domaines. De plus, nous présentons une architecture plus généralisée et proposons le Réseau Neuronal Conscient des Interactions (INN) ainsi que DeepIFM pour capturer les interactions d'ordre supérieur. Pour améliorer davantage les performances et l'efficacité de l'IFM, un schéma d'échantillonnage a été développé afin de sélectionner les interactions en fonction de leur importance selon l'aspect des domaines.Les résultats expérimentaux issus de deux jeux de données bien connus montrent la supériorité des modèles proposés par rapport aux méthodes les plus avancées actuellement disponibles.