Command Palette
Search for a command to run...
MITS : Amélioration du raisonnement par recherche arborescente pour les LSM grâce à l'information mutuelle ponctuelle
Jiaxi Li Yucheng Shi Jin Lu Ninghao Liu

Résumé
La recherche arborescente est devenue un cadre représentatif du raisonnement à l’heure du test avec les grands modèles linguistiques (LLM), illustré par des méthodes telles que Tree-of-Thought et la recherche arborescente de Monte Carlo, qui explorent plusieurs chemins de raisonnement. Toutefois, il reste difficile d’obtenir des évaluations quantitatives instantanées et fiables de la qualité des étapes intermédiaires du raisonnement, et une exploration extensive des chemins s’avère coûteuse en termes de calcul. Pour répondre à ce défi, nous proposons Mutual Information Tree Search (MITS), un cadre novateur qui guide le raisonnement selon des principes d’information théorique. MITS introduit une fonction de notation efficace basée sur l’information mutuelle ponctuelle (PMI), permettant une évaluation étape par étape des chemins de raisonnement et une expansion de l’arbre de recherche par recherche par faisceau (beam search), sans nécessiter de simulations de regard en avant coûteuses, tout en atteignant des performances de raisonnement supérieures tout en maintenant une efficacité computationnelle élevée. Ce cadre est complété par une stratégie dynamique d’échantillonnage fondée sur l’entropie, qui alloue de manière adaptative les ressources computationnelles aux étapes de raisonnement incertaines, où l’exploration est la plus bénéfique. Pour la prédiction finale, MITS utilise un schéma de vote pondéré combinant les scores PMI et le consensus de prédiction. À travers des expériences approfondies sur divers benchmarks de raisonnement, MITS surpasse de manière cohérente les méthodes de référence, établissant ainsi un cadre rigoureux et efficace pour le raisonnement des LLM.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.