小米掀桌子!大模型 API 最高降 99%,真降价还是营销噱头?

编者按:

2026 年 5 月下旬,国产大模型行业突然掀起一轮猛烈的降价潮。5 月 22 日,DeepSeek 率先下调 API 价格;仅仅五天后,小米在 5 月 27 日正式宣布,MiMo‑V2.5 系列大模型 API 开启永久降价。最高 99% 的降幅、取消长文本阶梯溢价、套餐 Token 用量直接提升 5 到 8 倍,一连串动作迅速引爆行业讨论。有人说这是 AI 普惠的真正开始,也有人质疑不过是吸引眼球的数字游戏。小米到底是真心让利,还是营销造势。

数据说话

99% 降幅有明确场景,定价规则被彻底重构

“最高直降 99%” 的消息一出,不少人的第一反应是:会不会又是文字游戏?

结合小米官方发布的完整调价信息可以确认,这次降价并非虚标,但有一个关键前提必须说清:99% 的最大降幅,只针对缓存命中的输入 Token。

本次降价仅覆盖 MiMo‑V2.5、MiMo‑V2.5‑Pro 两个主力版本,高阶模型如 MiMo‑V2‑Pro、V2‑Omni 以及语音 TTS 并不在范围内,而且所有新价都是永久定价,不是短期促销。

先看旗舰款 MiMo‑V2.5‑Pro:缓存命中输入 Token 降至0.025 元/ 百万,对比原来长上下文 2.8 元的价格,降幅刚好99%;即便是对标短窗口版本,降幅也达到 98%。除此之外,未命中缓存的输入价格降至 3 元,较原价下降 79%;输出Token 降至 6 元,对比此前最高 42 元的价格,降幅达 86%。

标准版 MiMo‑V2.5 更亲民,缓存命中输入仅 0.02 元 / 百万 Tokens,未命中 1 元、输出 2 元,几乎把入门门槛压到了地板。

比降价更颠覆行业的,是小米直接取消了上下文窗口长度差价。

在此之前,行业普遍按窗口大小收费:256k 以内一个价,超过就涨价,长文档、知识库、合同分析等场景成本明显更高。小米这次直接统一价格,无论短对话还是百万字长文本,都按同一标准计费,相当于把长文本应用的成本壁垒直接拆掉。

与此同时,小米还升级了付费套餐:价格不变,但 Credit 兑换 Token 的比例提升5 至 8 倍。同样 39 元,过去只能买一份额度,现在能买到五六份甚至更多,对高频使用的 AI 客服、内容生成、智能助手项目来说,成本几乎被再次腰斩。

综合来看,99% 的极限降幅确实存在,而且集中在缓存命中这种高频场景 —— 企业客服、日常助手、固定知识库查询的命中率普遍超过 90%,绝大多数用户都能真正享受到低价。再加上统一窗口价、套餐加量,这已经不是单点噱头,而是一整套彻底下沉的定价体系。

真正让 AI 走向普及的,从来不是一时优惠,而是把价格压进日常可用的区间。

底气何在

技术把成本打下来,生态把格局打开

在整个行业对价格战慎之又慎的当下,小米为什么敢一次性降得这么狠?

答案不是 “烧钱”,而是技术能撑住,战略必须做。

小米这次降价的核心底气,来自推理与缓存技术的深度优化。MiMo‑V2.5 系列使用 SWA 分层 KV 缓存和稀疏注意力架构,简单说就是:能复用的绝不重算,能轻量化的绝不浪费算力。

KV 缓存的作用,是把历史对话、重复查询存下来,下次直接调用。小米的分层缓存技术把缓存成本直接降低 80%,这也是缓存场景能做到近乎免费的关键。在注意力机制上,模型采用 Full Attention 与 SWA 1:7 的混合结构,70 层里只有 10 层使用高算力模式,其余全部轻量化运行,在保证效果的前提下把算力用到极致。

也正因如此,小米官方明确表示,新价格可以实现基本收支平衡,不需要靠手机、汽车等业务持续输血补贴。

敢把价格打到极致,靠的不是勇气,而是把成本做到极致的技术实力。

从行业竞争看,小米的动作也并非突发奇想。

5 月 22 日 DeepSeek 降价,5 月 27 日小米紧跟,两者最终定价高度接近。这不是巧合,而是行业逻辑正在转变:大模型能力差距逐步缩小,价格、服务、开发者生态,变成了新一轮竞赛的核心。对后来者而言,用合理低价吸引开发者入场,是最直接、最有效的破局方式。

再回到小米自身。

2026 年一季度,小米营收 991 亿元,同比下滑 10.9%;经调整净利润 61 亿元,同比下降 43.1%。手机业务进入存量期,汽车业务仍在投入,增长压力显而易见。在这样的背景下,AI成为小米最确定的新增长曲线。雷军也曾公开表示,未来三年将投入 600 亿元布局 AI。

这次 API 大降价,本质就是以价换生态:

用更低的成本吸引开发者、中小企业、创业团队基于 MiMo 做应用;应用越多,小米手机、车机、IoT 设备的智能体验就越强;终端再反过来拉动模型使用量,最终形成 “大模型 — 应用 — 终端” 的闭环。

低价只能打开一扇门,真正留住开发者的,是完整的生态与持续的价值。

当然,这场价格战也会加速行业洗牌。有技术、有算力、有现金流的大厂能继续玩,缺乏自研能力、只靠大模型单打独斗的中小厂商会越来越难。同时也要客观看到,MiMo‑V2.5 在长链推理、代码能力、幻觉控制等方面,和行业第一梯队仍有差距。低价能带来第一次尝试,但能不能留住用户,最终还是要看模型本身的实力。

结      语

综合官方数据、技术支撑与行业格局来看,小米这次 API 大降价,并不是一场营销噱头,而是技术降本与生态战略共同推动的理性选择。99% 的降幅有明确场景支撑,取消长文本溢价、套餐扩容等规则,也实实在在降低了整个 AI 开发的门槛。

这场调价,正式把国产大模型推进普惠时代。价格战会倒逼全行业提升效率、压缩冗余成本,但行业的终极比拼,从来不是谁更便宜。

小米用 “掀桌子” 的方式搅动了市场,但真正的考验才刚刚开始。

AI 行业的胜负,从来不在谁更便宜,而在谁更能创造长期价值。

声明:本文为维科号作者发布,不代表维科号立场。如有侵权或其他问题,请及时联系我们举报。