Command Palette
Search for a command to run...
GRITv2 : Reconnaissance efficace et légère des relations sociales
GRITv2 : Reconnaissance efficace et légère des relations sociales
N K Sagar Reddy Neeraj Kasera Avinash Thakur
Résumé
Notre recherche se concentre sur l'analyse et l'amélioration du modèle de Transformer d'inférence des relations basé sur les graphes (Graph-based Relation Inference Transformer, GRIT), qui constitue une référence importante dans le domaine. Nous menons une étude exhaustive par élimination (ablation study) en utilisant le jeu de données PISC-fine, afin de trouver et d'explorer des améliorations en termes d'efficacité et de performance pour la version GRITv2. Notre recherche a fourni un nouveau modèle d'état de l'art pour la reconnaissance des relations sur le jeu de données PISC relation. Nous introduisons plusieurs fonctionnalités dans le modèle GRIT et analysons nos nouvelles références dans deux versions : GRITv2-L (grande) et GRITv2-S (petite). Notre proposition de GRITv2-L dépasse les méthodes existantes en matière de reconnaissance des relations, tandis que GRITv2-S reste à moins de 2% de performance par rapport à GRITv2-L, avec seulement 0,0625 fois sa taille et ses paramètres. De plus, nous abordons également la nécessité de la compression des modèles, un domaine crucial pour le déploiement de modèles efficaces sur des plateformes à ressources limitées. En appliquant des techniques de quantification, nous avons réduit efficacement la taille de GRITv2-S à 22 Mo et l'avons déployé sur le smartphone phare OnePlus 12, qui continue d'excéder les benchmarks PISC-fine en termes de performance. Cela souligne la viabilité pratique et l'efficacité améliorée de notre modèle sur les appareils mobiles.