HyperAI超神经

Le modèle Gemini 2.5 Flash-Lite est désormais disponible en version stable et générale. Il s'agit du modèle le plus rapide et le moins coûteux de la famille Gemini 2.5, avec un prix de 0,10 dollar par million de tokens d'entrée et de 0,40 dollar par million de tokens de sortie. Conçu pour offrir un maximum d'intelligence au coût minimal, ce modèle intègre des capacités de raisonnement natives, pouvant être activées selon les besoins pour des tâches plus exigeantes. Il complète ainsi l'ensemble des modèles Gemini 2.5 prêts à l'usage à grande échelle. Gemini 2.5 Flash-Lite équilibre efficacement performance et coût, tout en maintenant une qualité élevée, notamment pour les tâches dépendantes du délai comme la traduction et la classification. Il présente une latence inférieure à celle des versions 2.0 Flash-Lite et 2.0 Flash sur un large échantillon de prompts. En outre, il est le modèle le plus économique de la série 2.5, avec une réduction de 40 % du prix des entrées audio par rapport à sa version de prévisualisation. Le modèle offre également une qualité globale supérieure à celle de 2.0 Flash-Lite, notamment dans les domaines du codage, des mathématiques, des sciences, du raisonnement et de la compréhension multimodale. Ce modèle propose également une gamme complète de fonctionnalités, notamment une fenêtre de contexte de 1 million de tokens, une gestion ajustable des ressources de traitement, et un accès à des outils natifs comme le Grounding avec Google Search, l'exécution de code et le contexte des URL. Depuis son lancement, plusieurs entreprises ont déjà déployé ce modèle avec succès. Satlyt, par exemple, utilise Gemini 2.5 Flash-Lite pour réduire de 45 % la latence dans les diagnostics en temps réel des satellites et de 30 % la consommation d'énergie. HeyGen l'utilise pour automatiser la planification vidéo, l'analyse du contenu et la traduction en plus de 180 langues. DocsHound l'applique pour transformer les démonstrations de produits en documentation en extrayant rapidement des milliers de captures d'écran. Evertune, quant à elle, profite de sa rapidité pour analyser et générer des rapports sur les représentations des marques dans les modèles d'IA. Les utilisateurs peuvent désormais utiliser le modèle en spécifiant « gemini-2.5-flash-lite » dans leur code. Les utilisateurs de la version bêta peuvent passer à la version stable, qui est basée sur le même modèle. Le nom de la version bêta sera supprimé le 25 août. Le stable version est disponible dans Google AI Studio et Vertex AI. En termes d'évaluation, des experts du secteur soulignent que cette évolution marque une avancée significative dans la prise en charge des applications à grande échelle, offrant un équilibre optimal entre rapidité, coût et qualité. Les entreprises qui utilisent des modèles d'IA à haute performance pourraient bénéficier de cette solution pour optimiser leurs opérations tout en réduisant leurs dépenses.

Gemini 2.5 Flash-Lite désormais stable et accessible à tous

Related Links