小米开放平台上线 MiMo API 全球 token 计划
小米于北京时间 2026 年 5 月 27 日零点正式开启 MiMo 全球开发者平台,并同步宣布 MiMo-V2.5 系列永久降价。此次调价是小米对底层技术持续优化的成果,旨在通过大规模应用推动 AI 基础设施的建设。根据新政策,MiMo-V2.5 系列 API 价格最高下调 99%,且不再区分输入长度计费。这一调整不仅大幅降低了开发成本,还提升了服务性价比。此次价格变更于北京时间 5 月 27 日零点全球同步生效,所有 Token 套餐内的用户额度将被重置,并按新规则执行。对于参与过“十万亿 Token 创作者激励计划”的用户及 Apache 软件基金会成员,其专属福利将延续有效。此前,该激励计划因用户热情高涨而提前结束,所有 100 万亿 Token 已在全渠道发放完毕。小米技术团队解释称,降价得益于推理系统的重大升级。通过基于 SGLang HiCache 的滑动窗口注意力机制(SWA),系统成功将多级存储间的数据传输量降低至原来的七分之一,同时将可缓存 Token 数量提升五倍,显著提高了缓存命中率和推理效率。此外,通过优化专家并行方案与输入长度分桶策略,集群的吞吐量能力得到增强,从而在保障服务质量的前提下进一步降低了单次 Token 的服务成本。小米方面表示,让更广泛的人群享受到优质且低成本的模型服务是 MiMo 的不变使命,未来将继续依托技术创新,促进 AI 技术的规模化落地。
