Chaîne De Pensée
La chaîne de pensée (CoT) est une technique permettant d’améliorer les capacités de raisonnement logique dans les grands modèles linguistiques. Ce concept a été proposé pour la première fois par Jason Wei, chercheur principal chez Google Brain, et publié dans un article intitulé «L'incitation à la chaîne de pensée suscite le raisonnement dans les grands modèles linguistiques" est élaboré en détail dans ". La technologie CoT décompose les problèmes complexes en une série de réponses aux sous-problèmes étape par étape, guidant le modèle pour générer un processus de raisonnement détaillé, améliorant ainsi les performances du modèle sur des tâches complexes telles que le raisonnement arithmétique, le raisonnement de bon sens et le raisonnement symbolique.
Le principal avantage de la technologie CoT est qu’elle peut améliorer considérablement l’interprétabilité du modèle et aider le modèle à effectuer un raisonnement logique complexe, en particulier dans les problèmes qui nécessitent de combiner plusieurs faits ou éléments d’information. Il imite le processus de raisonnement humain, qui ne conduit généralement pas directement à une réponse, mais plutôt à travers une série d’étapes de réflexion, d’analyse et de raisonnement. Les méthodes CoT sont divisées en deux formes : CoT à quelques coups basé sur l'annotation manuelle d'exemples et CoT à zéro coup sans annotation manuelle d'exemples. Le CoT à quelques coups démontre le processus de raisonnement en fournissant un petit nombre d'exemples, tandis que le CoT à zéro coup stimule le modèle à générer des chaînes de raisonnement à travers des invites spécifiques (telles que « Réfléchissons étape par étape ») sans avoir besoin d'exemples supplémentaires.