中国数智化转型网 人工智能资讯 每日人工智能资讯|小米 MiMo-V2.5 系列 API 永久降价,最高降幅达 99%

每日人工智能资讯|小米 MiMo-V2.5 系列 API 永久降价,最高降幅达 99%

在 AI 模型价格战持续升温的背景下,小米旗下 MiMo 大模型于5月27日正式发布公告,对其 MiMo-V2.5系列 API 实施永久性降价,并同步优化了计费体系,旨在通过技术红利进一步降低开发者的调用成本。

一、API 价格大幅下调,最高降幅99%

本次调价已于北京时间 5月27日0:00 全球同步生效。此次调整覆盖 MiMo-V2.5和 MiMo-V2.5Pro 两个核心版本,且不再区分上下文窗口长度,定价策略更趋向于极简与透明。数智化转型网www.szhzxw.cn

模型版本输入缓存命中价格最高降幅输出价格最高降幅
MiMo-V2.5Pro0.025元/百万 tokens99%6元/百万 tokens86%
MiMo-V2.50.02元/百万 tokens98%2元/百万 tokens93%

二、计费体系升级:加量不加价

除了直接的 API 单价下调,小米还对 Token Plan 计费体系进行了深度优化:

  • 额度翻倍: 在保持原价格标准的前提下,Token 的实际用量额度提升至原来的 5至8倍

  • 规则简化: 引入 Credits(积分) 概念,旨在替代此前复杂的计费方式,使开发者对 Token 的消耗与成本计算更直观、易懂。数智化转型网www.szhzxw.cn

三、技术底座:为何能持续降价?

小米官方透露,此次大幅降价的底气源于其在推理系统底层架构上的技术突破:

  1. SWA 推理优化: 基于 SGLang HiCache 完整支持 SWA(滑动窗口注意力机制),使得 KV Cache 在 GPU 显存、CPU 内存及 SSD 之间的多级搬运数据量减少至原来的1/7。数智化转型网www.szhzxw.cn

  2. 缓存效率提升: 可缓存 Token 数量激增至优化前的近5倍,显著提升了缓存命中率,大幅摊薄了单位推理成本。数智化转型网www.szhzxw.cn

  3. 集群吞吐优化: 通过引入专家并行(MoE)方案与输入长度分桶策略,集群的输入吞吐能力得到质的提升,确保在服务质量保持高水准的同时,持续压低单位 Token 的服务成本。

小米此举被业内视为对当前大模型商业化“内卷”的积极回应。随着价格门槛的进一步降低,MiMo 系列模型的性价比优势将进一步显现,加速 AI 能力在各垂直行业及开发者工作流中的深度渗透。

若您对人工智能感兴趣,可添加数智化转型网小助手思思微信加入人工智能交流群。若您在寻找人工智能供应商,可联系数智化转型网小助手思思(17757154048,微信同号)

思思微信二维码

若您为人工智能服务商,可添加数智化转型网小助手Nora,加入人工智能行业交流群。

Nora微信二维码

若您为人工智能创业者,可添加数智化转型网社群主理人Carina,加入人工智能创业交流群。

Carina微信二维码

声明:本文来自数智化转型网,版权归作者所有。文章内容仅代表作者独立观点,不代表数智化转型网立场,转载目的在于传递更多信息。如有侵权,请联系我们。

底部图片
免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。 本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。https://www.szhzxw.cn/121059.html
联系我们

联系我们

17717556551

邮箱: editor@cxounion.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部