k8凯发天生赢家

新闻中心 新闻中心

雷军颁发:大幅降价 ,最高降99%!

5月27日一早 ,雷军在微博

作者:胡永升
颁布功夫:2026-06-03 02:02:24
阅读量:253

雷军颁发:大幅降价 ,最高降99%!

5月27日一早 ,雷军在微博颁发 ,幼米MiMo-V2.5系列做了一次大幅度的价值调整 ,最高降幅达到99% ,不再分辨高低文窗口 。

幼米:MiMo-V2.5系列API永远降价

对价值系统进行永远性翻新

@幼米技术暗示 ,过往几个月 ,通过MiMoOrbit、百万亿Token创造者激励打算等活动 ,让更多人有机遇履历MiMo ,并解决真实的问题——这是MiMo在规 ;寐仿飞系牡谝徊 。而此刻 ,随着底层技术的不休精进 ,终于能够做一件更彻底的事——对整个模型价值系统进行一次永远性翻新 。

MiMo-V2.5系列API永远降价

相比原始API定价 ,新定价最高降幅可达99% ,且不再分辨高低文窗口长度 。

本次调价于北京功夫5月27日0:00正式生效 ,全球同措施整 。

TokenPlan计费系统优化

加量不加价 ,用量提升至原5-8倍 ,解锁更充分的出产力 。示例:在Agent或Code场景下 ,可用Token数量为:

计费规定调整 ,越发清澈易懂 ,所见即所得 。

此表 ,无论当前套餐用量若何 ,所有已订阅TokenPlan且当前仍在有效期的用户(蕴含参加百万亿Token创造者激励打算并获得TokenPlan的用户 ,涵盖Apache软件基金会专属福利用户)的Credits额度将于北京功夫5月27日0点全量重置 ,并按新计费规定执行 。

幼米技术暗示 ,本次价值调整背后 ,离不开团队在推理系统上的持续优化  ;赟GLangHiCache齐全支持SWA(SlidingWindowAttention) ,将KVCache在GPU显存、CPU内存、SSD等多级存储之间的数据搬运量降低至优化前的近1/7 ,并将可缓存token数量提升至优化前的近5倍 ,显著提升了缓存射中率和推理效能 。

同时 ,通过优化专家并行规划、输入长度分桶战术等 ,进一步提升了集群输入吞吐能力 ,从而在保险服务质量的前提下持续降低单元token服务成本 。后续将颁布越发具体的推理优化技术Blog 。

橙柿互动 ·都市快报综合报路

编纂 潘俐

审核 张倩 王晨郁

校对 叶芹

 

文章点评

未查问到任何数据!

颁发评论

◎迎接参加会商 ,请在这里颁发您的见解、互换您的概想 。

最新文章

热点文章

随机推荐

【网站地图】