Gemini 3 tient ses promesses — mais avec des limites
Google a lancé la famille de modèles Gemini 3, dont le modèle phare, Gemini 3 Pro, promet des progrès significatifs en matière de raisonnement, de concision des réponses et de capacité à traiter des tâches complexes. L’un des points forts annoncés est l’amélioration de Canvas, l’espace de travail intégré dans l’application Gemini, où l’IA peut générer du code et afficher des prévisualisations interactives. Google affirme que Gemini 3 peut désormais traiter simultanément différents types de données — texte, images, vidéos — et produire des visualisations 3D interactives, des simulations ou des interfaces utilisateur riches, même pour des requêtes complexes, notamment en mode « zero-shot » (sans entraînement spécifique). Dans une première expérience, j’ai demandé à Gemini 3 de créer une visualisation 3D comparative des échelles entre une particule subatomique, un atome, une molécule d’ADN, une balle de plage, la Terre, le Soleil et la galaxie. Le résultat était fonctionnel : une interface interactive permettant de naviguer entre les objets par ordre croissant de taille, avec une représentation globalement correcte. Toutefois, la qualité visuelle était inférieure à celle des démonstrations officielles : les modèles 3D de l’ADN et de la balle de plage apparaissaient trop sombres et peu détaillés. Des essais similaires avec d’autres exemples de Google ont révélé le même écart : l’IA comprend bien le concept, mais la qualité finale est souvent moins soignée, avec des résolutions plus faibles ou une organisation moins fluide. Des tests plus simples, comme la création d’un aigle en style voxel sur une branche, ont montré des résultats approximatifs : l’aigle manquait d’yeux, les arbres étaient sans tronc. Des modèles 3D standard comme ceux d’un pingouin ou d’une tortue étaient très simplifiés, avec peu de détails. Malgré ces limites, les fonctionnalités visuelles de Gemini 3 Pro sont impressionnantes. Google teste une fonction « interface visuelle » pour les abonnés Pro, qui transforme les réponses en pages web interactives ou en formats magazine. J’ai testé une proposition de voyage à Rome : le résultat était une page personnalisée avec un itinéraire, des options de personnalisation (rythme, type de repas), et une réorganisation dynamique selon mes préférences. Cette fonctionnalité s’avère utile pour des guides interactifs sur des sujets comme l’assemblage d’un ordinateur ou l’installation d’un aquarium. L’autre fonction phare, l’agent agissant (Gemini Agent), disponible pour les abonnés Ultra, vise à exécuter des tâches autonomes, comme gérer l’agenda ou organiser l’email. J’ai demandé à l’IA d’organiser mon courrier Gmail. Elle a identifié 99 messages non lus, les a regroupés dans un graphique interactif, suggéré des rappels pour les plus importants (invitations, factures) et proposé d’archiver les spams. Lorsque j’ai demandé de planifier un rappel pour une facture, elle l’a ajouté à Google Tasks avec la date correcte. En revanche, lorsqu’elle a tenté de payer la facture, elle a failli me guider vers l’interface de paiement, mais a été interrompue par sécurité. Bien que l’IA soit plus efficace que l’action manuelle pour repérer des courriels oubliés, son intégration avec Gmail, bien que plus poussée que celle de Perplexity ou ChatGPT, est plus lente pour envoyer des messages. Enfin, la tentative de réservation de restaurant a échoué : l’IA a mentionné une « charge » pour la réservation, avant de s’excuser en disant qu’il s’agissait probablement d’un pourboire de 16 %, puis a demandé confirmation trois fois, créant de la confusion. Malgré ces hésitations, Gemini 3 Pro se distingue par ses capacités de visualisation interactive, qui pourraient être utiles dans des contextes pédagogiques ou créatifs, même si elles ne sont pas essentielles au quotidien. Pour l’instant, je continue à l’utiliser comme un outil de recherche, pour des questions que je n’aurais pas trouvées facilement sur le web. Google a bien progressé, mais la réalité ne correspond pas encore entièrement à la promesse.
