HyperAIHyperAI

Command Palette

Search for a command to run...

Attendez, Nous N'avons Pas Besoin de « Attendre » ! La Suppression des Jetons de Pensée Améliore l'Efficacité du Raisonnement

Résumé

Les récentes avancées dans les modèles de raisonnement à grande échelle ont permis un raisonnement complexe et étape par étape, mais elles introduisent souvent une réflexion excessive, entraînant des sorties verbeuses et redondantes qui nuisent à l'efficacité. Dans cette étude, nous examinons si la réflexion explicite sur soi-même, signalée par des tokens tels que « Wait » (Attendez) et « Hmm » (Hum), est nécessaire pour un raisonnement avancé. Nous proposons NoWait, une approche simple mais efficace qui désactive la réflexion explicite sur soi-même en supprimant ces tokens lors de l'inférence. Des expériences approfondies sur dix benchmarks couvrant des tâches de raisonnement textuel, visuel et vidéo montrent que NoWait réduit la longueur de la trajectoire de la chaîne de pensée jusqu'à 27-51% dans cinq séries de modèles R1-style, sans compromettre l'utilité du modèle. Ainsi, NoWait offre une solution plug-and-play pour un raisonnement multimodal efficace et préservant l'utilité.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Attendez, Nous N'avons Pas Besoin de « Attendre » ! La Suppression des Jetons de Pensée Améliore l'Efficacité du Raisonnement | Articles | HyperAI