Xiaomi lance sa plateforme API MiMo à l'échelle mondiale
Xiaomi a annoncé le lancement mondial de la plateforme API MiMo avec des ajustements majeurs de tarification et la conclusion anticipée de son programme d'incitation à la création de tokens. Cette annonce marque une étape décisive pour l'application à grande échelle du modèle MiMo, rendue possible par des améliorations continues de la technologie sous-jacente. La modification la plus significative concerne la série de prix MiMo-V2.5. À partir du 27 mai 2026, 00h00, heure de Pékin, les tarifs de l'API subiront une baisse pouvant atteindre 99 % par rapport à l'ancienne structure, et ce, à l'échelle mondiale. Désormais, la facturation ne prendra plus en compte la longueur de l'entrée de texte, simplifiant ainsi considérablement le modèle de coûts pour les développeurs. En parallèle, le système de facturation du TokenPlan a été optimisé pour accompagner cette transition. Le programme d'incitation aux créateurs de tokens, visant la distribution de 100 billions de tokens, a connu un succès sans précédent. Lancé le 28 avril, cet objectif a été atteint avant l'échéance initiale, soit le 26 mai à 16h08, heure de Pékin. L'organisation remercie la communauté internationale pour son engagement enthousiaste. Il est précisé que les avantages exclusifs réservés aux membres de la fondation Apache Software Foundation restent valides indéfiniment et ne sont pas affectés par la clôture du programme. Dans le cadre de cette refonte, Xiaomi a mis en place une mesure surprise : toutes les quotas de crédits des utilisateurs du TokenPlan actuellement actifs, y compris ceux ayant participé au programme d'incitation et les membres de la fondation Apache, seront entièrement réinitialisés à 00h00 le 27 mai 2026. Ces nouveaux crédits suivront les nouvelles règles de facturation. Une annonce complémentaire concernant des cadeaux spéciaux pour les utilisateurs payants ayant vu leurs abonnements expirer sera publiée dans la semaine à venir. Ces ajustements tarifaires sont directement soutenus par des avancées techniques majeures dans le système d'inférence de Xiaomi. L'entreprise a intégré une technologie de cache HiCache basée sur SGLang et l'attention à fenêtre glissante (SWA). Cette innovation a permis de réduire les transferts de données pour le cache KV entre la mémoire GPU, le CPU et les disques SSD à environ un septième du volume initial. Parallèlement, la capacité de mise en cache a été multipliée par cinq, améliorant considérablement le taux de succès du cache et l'efficacité globale. De plus, la capacité de traitement par le cluster a été renforcée grâce à l'optimisation de la parallélisation des experts et à une stratégie de regroupement des longueurs d'entrée. Ces améliorations permettent de réduire le coût de service par token tout en maintenant la qualité du service. Xiaomi réaffirme sa mission de rendre l'utilisation de modèles avancés accessible au plus grand nombre. En combinant des coûts bas et des performances de pointe grâce à l'innovation continue, l'entreprise vise à soutenir une demande d'inférence durable à grande échelle et à construire une chaîne complète d'infrastructure IA.
