ChatGPT demande le contrôle total de votre ordinateur
OpenAI a annoncé jeudi le lancement de ChatGPT Agent, une nouvelle initiative dans l'espace en pleine expansion des "agents" d'intelligence artificielle (IA). Ces agents, contrairement aux chatbots traditionnels, sont capables d'exécuter des tâches spécifiques sur le dispositif de l'utilisateur. ChatGPT Agent utilise une sorte de "ordinateur virtuel" pour gérer des demandes complexes de bout en bout, comme examiner un calendrier et résumer les prochaines réunions avec des clients en se basant sur les dernières nouvelles, planifier et acheter les ingrédients nécessaires pour préparer un petit déjeuner japonais pour quatre personnes, ou analyser trois concurrents et créer une présentation PowerPoint. Le nouveau modèle derrière ChatGPT Agent, qui n'a pas encore de nom spécifique, a été développé par OpenAI en combinant les fonctionnalités de deux de ses outils existants : Operator et Deep Research. Operator est capable de naviguer sur des navigateurs web, tandis que Deep Research peut effectuer des recherches et des analyses en plusieurs étapes. Ce modèle a été formé à l'aide d'un apprentissage par renforcement sur des tâches complexes nécessitant l'utilisation de plusieurs outils, comme un navigateur web, un navigateur visuel et un terminal où les utilisateurs peuvent importer leurs propres données. Pour développer ChatGPT Agent, OpenAI a fusionné les équipes derrière Operator et Deep Research en une seule équipe composée de 20 à 35 personnes travaillant au développement produit et à la recherche. Yash Kumar, chef de produit, et Isa Fulford, responsable de la recherche, ont démontré les capacités de ChatGPT Agent lors d'une présentation. Ils ont montré comment l'agent peut planifier une soirée en amoureux en se connectant à Google Calendar pour trouver une soirée libre, puis en vérifiant les disponibilités sur OpenTable pour réserver une table dans un restaurant de choix. Ils ont également illustré comment l'agent peut générer un rapport de recherche comparatif sur l'essor des Labubus par rapport aux Beanie Babies. Bien que ChatGPT Agent semble très capable de traiter des opérations en plusieurs étapes, il peut être lent à accomplir ses tâches. Le Verge et Wired ont noté que l'agent met généralement plus de temps pour terminer une tâche, parfois même jusqu'à une heure pour commander des cupcakes. Cependant, Fulford a souligné que cela représente toujours un gain de temps car l'utilisateur "n’a pas à le faire lui-même." L'outil dispose également d'une fonction de "replay" permettant de revoir les étapes qu'il a suivies pour comprendre et exécuter les tâches. Avant d'effectuer des actions irréversibles, comme envoyer un email ou effectuer une réservation, ChatGPT Agent demande l'autorisation à l'utilisateur. De plus, l'accès aux transactions financières est actuellement restreint, et une protection supplémentaire appelée Watch Mode garantit que si l'utilisateur navigate vers des sites financiers, ils ne peuvent pas quitter l'onglet dans lequel l'agent travaille sans interrompre son fonctionnement. OpenAI a intégré des mesures de sécurité pour les capacités biologiques et chimiques de l'agent, même si la société n'a pas de preuves directes que le modèle pourrait aider un novice à créer des armes biologiques ou chimiques. Anthropic a activé des mesures de sécurité similaires pour son modèle Claude, Opus 4, en mai 2023. ChatGPT Agent sera d'abord disponible pour les utilisateurs abonnés aux plans ChatGPT Pro, Plus ou Team, qui pourront l'activer en sélectionnant "agent mode" dans le menu des outils ou en tapant "/agent". La société prévoit de le rendre accessible aux utilisateurs de ChatGPT Enterprise et Education plus tard cet été. Pour l'instant, il n'y a pas de calendrier de déploiement pour la Zone économique européenne et la Suisse. L'idée des agents d'IA est un sujet de discussion majeur dans l'industrie depuis plusieurs années. Les développeurs aspirent à créer des outils semblables à J.A.R.V.I.S. de Iron Man, capables de performer des fonctions spécifiques, de consulter des calendriers pour programmer des événements, ou d'acheter des cadeaux en fonction des préférences d'un ami. En 2023, le terme "AI agent" est devenu plus courant parmi les investisseurs et les dirigeants de l'industrie, notamment après que Klarna, une entreprise de fintech, a annoncé en février 2024 que son agent d'IA avait géré deux tiers des conversations de service client en un mois, équivalant au travail de 700 employés à plein temps. Cette annonce a incité d'autres entreprises technologiques, telles qu'Amazon, Meta, et Google, à mentionner leurs objectifs d'IA agente lors de leurs appels trimestriels. Google, par exemple, a récemment embauché le PDG, cofondateur et certains membres de l'équipe R&D de Windsurf pour accélérer ses projets d'IA agente. En octobre 2023, Anthropic, une entreprise de startup d'IA soutenue par Amazon, a lancé un outil similaire appelé "Computer Use," conçu pour utiliser un ordinateur de la même manière qu'un humain afin de compléter des tâches. D'autres entreprises, dont OpenAI, Google, et Perplexity, proposent également des outils d'IA appelés Deep Research, capables de rédiger des analyses et des rapports de recherche détaillés sur n'importe quel sujet choisi par l'utilisateur. Les agents d'IA sont donc une tendance majeure dans le domaine de l'IA, avec des sociétés de toutes tailles cherchant à capturer l'attention des consommateurs et à transformer ces outils en habitudes quotidiennes. OpenAI, en lançant ChatGPT Agent, s'inscrit dans cette dynamique, visant à offrir des solutions pratiques et efficaces, même si elles ne sont pas encore parfaites en termes de rapidité et de fluidité. Dans l'ensemble, l'arrivée de ChatGPT Agent marque une étape importante dans l'évolution de l'IA vers des outils plus autonomes et polyvalents. Bien que des défis restent à relever, notamment en termes de performance et de sécurité, l'engouement pour ces technologies montre une forte demande du marché et une volonté des entreprises de continuer à innover et à améliorer ces outils. Les réactions initiales, bien que mitigées, indiquent un potentiel significatif et une curiosité croissante des utilisateurs pour ces agents d'IA.