HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Tagen
LLM
Transformer

Xiaomi startet globale Token-Plattform für KI

Xiaomi hat am 27. Mai 2026 seine globale Plattform für die MiMo-API mit einer grundlegenden Neubewertung des Preissystems vorgestellt. Die Ankündigung markiert einen bedeutenden Schritt zur breiteren Einführung der Technologie, indem die Kosten für die Nutzung drastisch gesenkt werden. Die neuen Preise sind ab Mitternacht Pekinger Zeit am 27. Mai weltweit gültig und gelten für die gesamte MiMo-V2.5-Serie. Im Vergleich zum bisherigen Tarifmodell beträgt die maximale Preissenkung bis zu 99 Prozent. Ein zentrales Merkmal der neuen Struktur ist die Abschaffung der Preisdifferenzierung basierend auf der Eingabelänge. Parallel zur Preisreform wurde das TokenPlan-Abrechnungssystem optimiert. Das im April gestartete „Quadrillion Token Creator Incentive Program" wurde bereits erfolgreich abgeschlossen. Das Ziel, 100 Billionen Tokens zu verteilen, wurde noch vor dem geplanten Endtermin am 26. Mai vollständig erreicht. Xiaomi dankt allen Entwicklern für die intensive Teilnahme. Eine Ausnahme bildet das spezielle Wohlfahrtsprogramm für Mitglieder der Apache Software Foundation, das weiterhin beantragt werden kann und nicht von diesem Abschluss betroffen ist. Für alle Bestandsnutzer, die derzeit ein Token Plan-Abonnement haben und dessen Gültigkeitsdauer noch nicht abgelaufen ist, werden die Guthabenkonten zum 27. Mai vollständig zurückgesetzt. Dies gilt unabhängig vom aktuellen Verbrauch und schließt sowohl Teilnehmer des Incentive-Programms als auch Mitglieder der Apache-Community ein. Die abgerechneten Konten werden sofort nach den neuen Abrechnungsvorschriften weitergeführt. Zudem hat das Unternehmen für historische zahlende Nutzer mit abgelaufenen Plänen überraschende Zugaben vorbereitet, deren Details in der kommenden Woche bekanntgegeben werden sollen. Die technische Basis für diese drastischen Preissenkungen liegt in erheblichen Verbesserungen des Inference-Systems durch das Entwicklungsteam von Xiaomi. Durch die vollständige Unterstützung von SWA (Sliding Window Attention) auf Basis von SGLang HiCache konnte die Datenübertragungsmenge für den KV-Cache zwischen verschiedenen Speicherebenen wie GPU, CPU und SSD auf fast ein Siebteil des ursprünglichen Wertes reduziert werden. Gleichzeitig wurde die Anzahl der speicherbaren Tokens fast verfünffacht, was die Trefferquote des Caches und die Effizienz der Inferenz signifikant steigerte. Zusätzlich optimierte das Team die Input-Durchsatzkapazität des Clusters durch Verbesserungen beim Expert-Parallelismus und Strategien zur Eingabelängen-Bucketing. Dies ermöglichte eine kontinuierliche Senkung der Servicekosten pro Token bei gleichzeitiger Aufrechterhaltung der Servicequalität. Xiaomi betont, dass der wahre Wert der Technologie in ihrer breiten Anwendbarkeit liegt. Mit dem Ziel, nachhaltige und großflächige Inferenzanforderungen durch kostengünstige, leistungsstarke Modellservices zu bedienen, möchte das Unternehmen die Aufbauprozesse der gesamten KI-Infrastruktur vorantreiben. Die Mission von MiMo bleibt es, mehr Menschen den Zugang zu besseren Modellen zu ermöglichen.

Verwandte Links