HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 8 jours

Magellan : Exploration guidée de l'espace latent et génération de nouveauté par MCTS

Lufan Chang

Magellan : Exploration guidée de l'espace latent et génération de nouveauté par MCTS

Résumé

Les modèles de langage à grande échelle (LLM) peinent souvent à générer des idées véritablement innovantes, se contentant généralement de concepts familiers et à forte probabilité, situés dans les « puits de gravité » de leurs données d’entraînement. Bien que des méthodes avancées basées sur la recherche, telles que Tree of Thoughts (ToT), tentent de pallier ce problème, elles restent fondamentalement limitées par leur dépendance à des heuristiques d’évaluation auto-générées non fondées et incohérentes pour guider l’exploration. Pour combler cet écart, nous introduisons \textbf{Magellan}, un cadre novateur qui reformule la génération créative comme une exploration guidée et fondée d’un espace conceptuel latent du LLM. Au cœur de Magellan réside une recherche arborescente de Monte Carlo (MCTS), pilotée par un système hiérarchique de guidance. Pour orienter l’exploration à long terme, un vecteur « compas sémantique », formulé par projection orthogonale, oriente la recherche vers une nouveauté pertinente. Pour les décisions locales et pas à pas, une fonction de valeur consciente du paysage remplace l’évaluation auto-générée erronée par une structure de récompense explicite, équilibrant la cohérence intrinsèque, la nouveauté extrinsèque et l’évolution narrative. Des expériences étendues montrent que Magellan surpasse significativement des bases solides, notamment ReAct et ToT, dans la génération d’idées scientifiques caractérisées par une plausibilité et une innovation supérieures. Nos résultats démontrent qu’en matière de découverte créative, une recherche guidée et fondée s’avère plus efficace qu’une agence non contrainte, ouvrant la voie à une collaboration renforcée entre les LLM et les processus d’innovation.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Magellan : Exploration guidée de l'espace latent et génération de nouveauté par MCTS | Articles de recherche | HyperAI