HyperAIHyperAI

Command Palette

Search for a command to run...

Microsoft mise sur l'agent Fara-7B pour les appareils locaux

Microsoft a ouvert les poids de Fara-7B, un modèle de langage petit (SLM) de 7 milliards de paramètres conçu spécifiquement pour l'automatisation informatique. Lancé en novembre 2025, ce modèle permet à une IA d'opérer localement sur un ordinateur de bureau pour naviguer sur le web et contrôler des interfaces graphiques. Contrairement aux systèmes précédents qui dépendaient de modèles cloud massifs, Fara-7B fonctionne entièrement sur une station de travail équipée d'une carte graphique de 24 Go, marquant une transition vers des agents autonomes accessibles sur du matériel grand public. Ce modèle ne fonctionne pas comme un chatbot traditionnel. Il suit une boucle continue de perception, de raisonnement et d'action. En entrant par des captures d'écran, il prédit directement les coordonnées des mouvements de la souris et du clavier, agissant comme une interface visuelle sans passer par des parseurs DOM ou des arbres d'accessibilité. Son architecture repose sur une seule étape de réflexion visuelle et de décision, ce qui simplifie considérablement l'infrastructure par rapport aux systèmes multi-agents complexes qui nécessitent plusieurs modèles pour interpréter les écrans et exécuter les tâches. Le modèle a été affiné à partir de Qwen2.5-VL-7B et entraîné sur 145 000 trajectoires synthétiques générées par le cadre multi-agent Magentic-One de Microsoft. Cette approche de distillation permet au petit modèle d'apprendre les comportements complexes des grands systèmes sans en reproduire l'immense coût de calcul. Il intègre une sécurité native qui l'oblige à s'arrêter lors de points critiques, tels que les étapes de paiement ou de saisie de données sensibles, demandant l'autorisation humaine avant de finaliser une transaction. Cette fonctionnalité est inhérente à son entraînement plutôt qu'ajoutée par une couche logicielle externe. L'impact de cette sortie est triple. Premièrement, elle démontre que l'automatisation informatique n'est plus l'apanage des démonstrations de pointe nécessitant des ressources cloud coûteuses. Elle rend cette technologie viable pour un usage quotidien sur des équipements standards. Deuxièmement, elle établit une nouvelle méthode d'entraînement dominante : la génération de données par de grands agents suivie d'une distillation vers des modèles plus petits. On s'attend à ce que d'autres laboratoires adoptent ce schéma au cours de l'année. Enfin, bien que les benchmarks montrent des performances impressionnantes, les déploiements en production réelle restent un défi, révélant un écart significatif entre les résultats de laboratoire et la robustesse du monde réel. Cependant, la réduction de la taille du modèle n'implique pas une réduction automatique des risques de sécurité. Fara-7B hérite des vulnérabilités liées aux attaques adversariales visuelles, à la manipulation sémantique et à l'empoisonnement cognitif. En agissant directement sur les pixels, il est simultanément percevant, processeur et actionneur, ce qui élimine les couches de garde-fous traditionnelles entre la vision et l'exécution. Microsoft insiste dans sa documentation sur le fait qu'il s'agit d'une version expérimentale destinée à un environnement sandboxed, avec un monitoring rigoureux et l'interdiction d'entrer dans des domaines à haut risque ou de traiter des données sensibles. En somme, Fara-7B répond définitivement à la question de savoir si un petit modèle peut piloter un navigateur. Il inaugure une nouvelle ère où l'intelligence artificielle agentic peut s'exécuter localement, bien que l'adoption à grande échelle doive encore surmonter les défis de sécurité et de fiabilité en conditions réelles.

Liens associés

Microsoft mise sur l'agent Fara-7B pour les appareils locaux | Articles tendance | HyperAI