Command Palette
Search for a command to run...
L'utilisation Des Jetons a Diminué De 30%. Eywa, Un Cadre d'agent Intelligent Hétérogène Inspiré d'"Avatar", Combine Efficacement Des Modèles De Langage Avec Des Modèles De Base Spécifiques Au domaine.

Ces dernières années, l'IA agentique est devenue l'une des orientations évolutives les plus importantes dans le domaine de l'intelligence artificielle. De la programmation automatisée et de la recherche de connaissances à la planification des tâches, les grands modèles de langage (LLM) évoluent progressivement, passant de simples « chatbots » à des systèmes d'agents intelligents dotés de capacités de raisonnement, d'action et de collaboration autonomes. Cependant, un problème de plus en plus évident se pose également :La quasi-totalité des systèmes d'agents intelligents courants sont essentiellement des systèmes « centrés sur le langage ».Qu'il s'agisse de planification des tâches, d'invocation d'outils ou de collaboration entre agents intelligents, tout repose sur l'interface unifiée du langage naturel.
Ce paradigme fonctionne bien dans des contextes tels que les questions-réponses en ligne et la bureautique. Cependant, dès que l'IA s'immisce véritablement dans le domaine de la recherche scientifique, des problèmes surgissent rapidement. En effet, le monde scientifique n'appartient pas naturellement au langage. Séries temporelles, structures cristallines, séquences protéiques, grilles météorologiques, données d'observation par télédétection… ces données sont souvent très structurées et peuvent même s'avérer impossibles à « textualiser » efficacement.Les traduire de force en langage naturel entraînera non seulement une perte d'informations, mais aussi une consommation de jetons et une redondance d'inférence extrêmement élevées pour les modèles de grande taille.
Dans ce contexte,Une équipe de recherche de l'Université de l'Illinois à Urbana-Champaign (UIUC) a proposé un cadre d'agents hétérogènes appelé Eywa pour connecter des agents linguistiques avec des modèles fondamentaux spécifiques au domaine.Des chercheurs ont créé un nouvel agent Eywa en combinant un modèle de base spécifique au domaine avec un modèle de langage. Cette conception permet à l'agent de langage de guider le modèle de base dans ses processus de raisonnement, de planification et de prise de décision pour des tâches spécialisées.
Des chercheurs ont mené une évaluation systématique d'Eywa dans de multiples domaines, notamment les sciences physiques, les sciences de la vie et les sciences sociales. Les résultats ont montré que, par rapport aux systèmes de référence reposant uniquement sur des modèles de langage, Eywa améliorait systématiquement le compromis utilité-coût. Comparé au système de référence Single-LLM-Agent, EywaAgent a permis d'obtenir une amélioration moyenne de l'utilité d'environ 71 TP3T, une réduction du nombre de jetons d'environ 301 TP3T et une réduction du temps d'exécution d'environ 101 TP3T pour les tâches relevant des sciences physiques, des sciences de la vie et des sciences sociales. De même, dans les scénarios multi-agents, EywaMAS a également permis d'améliorer l'utilité tout en réduisant la consommation de jetons et le temps d'exécution.
Les résultats de recherche associés, intitulés « Collaboration du modèle de fondation scientifique hétérogène », ont été publiés en prépublication sur arXiv.
Points saillants de la recherche :
* Dans les tâches impliquant des données structurées et des données spécifiques au domaine, Eywa peut améliorer efficacement les performances du système.
* En collaborant efficacement avec un modèle sous-jacent dédié, Eywa réduit sa dépendance au raisonnement basé sur le langage.
* Eywa peut être étendu aux scénarios multi-agents : dans EywaMAS, EywaAgent peut remplacer l’agent linguistique dans un système multi-agents traditionnel ; dans EywaOrchestra, un planificateur peut coordonner dynamiquement l’agent linguistique et EywaAgent pour résoudre des tâches complexes.

Voir le document :
https://hyper.ai/papers/2604.27351
EywaBench : Un système d'évaluation scientifique « multitâche, multidomaine et multimodal ».
Avant de proposer ce cadre de modélisation, l'équipe de recherche a d'abord souligné un problème persistant des benchmarks actuels en IA scientifique :Autrement dit, la plupart des référentiels scientifiques actuels ne couvrent généralement qu'un seul type de tâche, se concentrent sur un seul domaine ou ne prennent en charge qu'un seul format de données.Par conséquent, elle ne reflète souvent pas pleinement les capacités réellement requises par les systèmes d'agents scientifiques.
L'équipe de recherche souligne en particulier que les référentiels actuels ont longtemps négligé l'évaluation de deux modalités essentielles : les séries temporelles et les données tabulaires. Ces deux types de données constituent le socle des systèmes de calcul scientifique et industriels. Par conséquent, l'article propose un nouveau cadre d'évaluation :EywaBench est un banc d'essai évolutif pour le raisonnement scientifique hétérogène, multitâche et multidomaine.
EywaBench est construit sur plusieurs ensembles de données existants, notamment :
* DeepPrinciple
* MMLU-Pro
* banc fev
* TabArena
EywaBench possède des capacités de couverture multitâches et multidomaines.Elle comprend trois modalités de données principales : le langage naturel, les séries temporelles et les données tabulaires.Toutes les tâches sont organisées en trois domaines scientifiques : le premier est celui des sciences physiques, qui comprend les matériaux, l’énergie et l’aérospatiale ; le deuxième est celui des sciences de la vie, qui comprend la biologie, la recherche clinique et le développement de médicaments ; et le troisième est celui des sciences sociales, qui couvre des domaines tels que l’économie, les affaires et les infrastructures.
Plus important encore, EywaBench est évolutif, permettant aux équipes de recherche d'étendre continuellement l'échelle de leurs tâches en ajoutant de nouvelles fenêtres temporelles, des combinaisons de variables et des configurations de contexte ; il peut également accéder à de nouveaux ensembles de données de séries temporelles et à des ensembles de données tabulaires pour s'étendre à de nouveaux domaines scientifiques.
Eywa : Connexion des agents linguistiques aux modèles de base spécifiques au domaine
Eywa s'inspire principalement du concept de « Tsaheylu » du film Avatar. Sur Pandora, les Na'vi peuvent établir des relations de collaboration directes avec différentes espèces, comme les dragons et les chevaux de guerre, grâce à des connexions neuronales, permettant ainsi à ces créatures de former une force d'action unifiée.
L'équipe de recherche estime que les systèmes agentiques actuels sont également confrontés à des problèmes similaires. Les LLM possèdent des capacités de raisonnement et de planification de haut niveau, mais ne sont pas aptes à traiter des données scientifiques brutes ; les modèles basés sur un domaine possèdent de solides compétences professionnelles, mais sont incapables d’effectuer un raisonnement complexe sur des tâches.Par conséquent, cet article propose l'interface FM–LLM « Tsaheylu », qui établit essentiellement un mécanisme de communication bidirectionnel entre le modèle de langage et le modèle de domaine de base, comme illustré dans la figure ci-dessous :

Étape 1 : Créer un agent Eywa
La première étape vers le cadre d'agents Eywa consiste à proposer EywaAgent, un cadre abstrait unifié qui ajoute une interface de raisonnement basée sur le langage au modèle de base, lui permettant de participer à des processus de raisonnement de haut niveau au sein des systèmes d'agents.Son idée centrale est d'établir un lien fort entre le modèle de langage permettant d'exécuter la planification et le contrôle de haut niveau et le modèle de base spécifique au domaine qui fournit les capacités professionnelles.
EywaAgent combine le raisonnement basé sur le langage avec le calcul spécifique au domaine via une interface de communication bidirectionnelle appelée chaîne FM-LLM « Tsaheylu ».Ce lien permet de configurer correctement le modèle de langage et de faire appel au modèle sous-jacent pour des calculs spécialisés.Dans le même temps, le résultat est réintégré sans problème dans le processus d'inférence.
L'interface Tsaheylu est formalisée par deux fonctions : le compilateur de requêtes ϕk traduit les états des tâches en appels structurés au modèle de base, tandis que l'adaptateur de réponse ψk convertit la sortie du modèle de base en une représentation dans un langage compatible. Ce pipeline de communication permet à l'agent de décider dynamiquement d'effectuer les calculs en interne ou de les déléguer au modèle de base, s'adaptant ainsi avec souplesse entre inférence générale et exécution spécialisée.
Étape 2 : Étendre au système d’agents Eywa
Après avoir défini EywaAgent comme un module agent prêt à l'emploi, l'équipe de recherche a étendu ce paradigme aux scénarios multi-agents afin de prendre en charge une coopération collaborative plus complexe et hétérogène. À cette fin, l'article propose deux abstractions complémentaires au niveau système :
EywaMAS
EywaAgent est étendu aux environnements multi-agents distribués, permettant à plusieurs agents spécialisés d'interagir et de collaborer. La dynamique de communication et de mise à jour d'état d'EywaMAS suit le modèle standard des systèmes multi-agents : les agents mettent à jour leur état et génèrent des messages en fonction des informations reçues, et les interactions sont contrôlées par la topologie de communication. Cette méthode prend en charge des combinaisons flexibles de différents modèles de langage, modèles de base et types d'agents.

EywaMAS est une extension des systèmes multi-agents existants.
Orchestre Eywa
Pour répondre aux exigences variées des tâches réelles, compte tenu des différentes configurations d'agents et de topologies, le framework introduit EywaOrchestra, un système d'orchestration dynamique. EywaOrchestra agit comme un chef d'orchestre, instanciant dynamiquement des systèmes multi-agents hétérogènes en fonction de la tâche à accomplir, grâce à la sélection de modèles de langage, de modèles de base et de topologies de communication appropriés. Cette orchestration adaptative permet au système de s'affranchir des limitations d'une conception statique, en tirant parti de l'adaptabilité des modèles et de la structure pour sélectionner la configuration optimale pour chaque tâche.
Eywa réalise une amélioration continue du compromis entre utilité et coût.
L'équipe de recherche a testé toutes les méthodes à l'aide d'EywaBench selon un protocole expérimental unifié. Le tableau ci-dessous présente les performances globales de toutes les méthodes sur la tâche scientifique d'EywaBench, et les résultats expérimentaux permettent de tirer plusieurs conclusions importantes :

Comparaison des performances globales d'EywaBench dans les missions scientifiques
Remarque : Le tableau compare toutes les méthodes selon trois dimensions : l’utilité (plus elle est élevée, mieux c’est), le temps d’inférence (plus il est faible, mieux c’est) et la consommation de jetons (plus elle est faible, mieux c’est). Les résultats optimaux sont indiqués en gras et les résultats secondaires par un trait de soulignement.
Premièrement, EywaAgent améliore à la fois la qualité et l'efficacité du système dans les mêmes conditions d'infrastructure.Comparé au modèle LLM mono-agent de référence, EywaAgent améliore l'utilité moyenne de 6,61 TP3T. Par ailleurs, grâce à la délégation importante de calculs au modèle sous-jacent spécifique au domaine, sa latence d'inférence est considérablement réduite, et la consommation de jetons est également réduite de près de 301 TP3T.
Deuxièmement, EywaMAS surpasse nettement les systèmes multi-agents isomorphes traditionnels dans les scénarios scientifiques.Les expériences montrent qu'EywaMAS offre la meilleure utilité globale parmi toutes les méthodes. Comparé à Refine, EywaMAS présente un avantage significatif en termes de performances ; et comparé à Debate, EywaMAS offre non seulement une utilité supérieure, mais nécessite également moins de jetons dans une même topologie de débat.
Le troisième constat important est que le recours exclusif à des « modèles de langage hétérogènes » est insuffisant pour résoudre les tâches scientifiques.Les méthodes MAS hétérogènes utilisant uniquement des modèles de langage (telles que MoA et X-MAS) présentées dans l'article n'ont pas systématiquement surpassé la méthode de référence multi-agents fortement homogène. Ceci suggère que, pour les tâches scientifiques, l'élément véritablement crucial n'est pas la combinaison de plusieurs modèles de langage différents, mais plutôt l'introduction d'une hétérogénéité intermodale. Autrement dit, un modèle de séries temporelles financières ou un modèle de prédiction biologique s'avère souvent plus pertinent que l'ajout d'un modèle de langage.
L'article souligne également que tous les domaines ne tirent pas profit d'une collaboration multi-agents plus complexe. Dans des sous-domaines tels que l'économie et le commerce, l'agent unique EywaAgent est déjà très compétitif. Cela signifie que les topologies multi-agents complexes ne sont pas toujours optimales. Dans certaines tâches, une collaboration excessive peut même engendrer des coûts supplémentaires.
L'expérience a également démontré qu'EywaOrchestra, à moindre coût et avec un degré d'automatisation plus élevé, atteint des performances quasi parfaites comparées à EywaMAS, conçu par des experts. Contrairement à EywaMAS, qui nécessite une configuration manuelle,L'architecture du système d'EywaOrchestra est entièrement construite automatiquement par le chef d'orchestre.Néanmoins, son utilité se rapproche de celle des systèmes conçus manuellement, et la surpasse même dans plusieurs sous-domaines. Parallèlement, le mécanisme d'orchestration dynamique réduit considérablement la latence d'inférence et la consommation de jetons. Ceci démontre que l'orchestration adaptative des systèmes améliore non seulement les niveaux d'automatisation, mais optimise également efficacement les coûts d'inférence.
Conclusion
Ces dernières années, le thème central de l'industrie de l'IA a presque toujours été celui des « grands modèles » : des paramètres plus nombreux, un contexte plus étendu et des capacités de raisonnement plus puissantes. L'ensemble du secteur s'efforce de construire un « modèle général capable de résoudre tous les problèmes ».
Cependant, l'approche d'Eywa démontre que la collaboration native aux modalités peut considérablement améliorer les capacités des systèmes multi-agents dans les contextes scientifiques et ouvre de nouvelles perspectives pour le raisonnement collaboratif de modèles de base hétérogènes. Autrement dit, ce qui comptera vraiment à l'avenir, ce n'est pas une IA toute-puissante, mais un système d'IA capable d'organiser des experts aux profils variés pour travailler en collaboration.
Références :
https://arxiv.org/abs/2604.27351
https://hyper.ai/cn/papers/2604.27351








