小米发布MiMo-V2.5-Pro UltraSpeed模式:3倍价格换来10倍生成速度

小米发布MiMo-V2.5-Pro UltraSpeed模式:3倍价格换来10倍生成速度

小米MiMo官方昨日宣布,与TileRT公司联合推出Xiaomi MiMo-V2.5-Pro的UltraSpeed模式,通过模型与系统的极致协同设计,在通用GPU上实现了万亿参数模型生成速度首次突破1000 tokens/s。

据官方演示,该模式可在10秒内完成一个贪吃蛇小游戏的生成,1分钟内复刻一个macOS系统界面,性能提升十分显著。与此同步上线的还有MiMo-V2.5-Pro-UltraSpeed API,采用限时体验价,定价为普通版MiMo-V2.5-Pro的3倍,但能提供约10倍的输出速度提升。

需要说明的是,该模式仅支持API体验,不兼容Token Plan。作为参考,普通版每百万tokens输入缓存命中为0.025元、未命中为3元,每百万tokens输出为6元。小米官方将这一模式形容为“3倍价格提升,10倍输出体验”。由于高速推理资源供给有限,本次UltraSpeed模式采取申请制限时开放,时间为2026年6月9日至6月23日23:59。试用名额有限,小米表示将优先审核具备真实业务需求的企业与专业开发者场景,不承诺审核时效性和通过率。

通过审核的用户可获得限时免费的Chat体验,但每个账号每日最多成功进入队列10次,单次会话时长上限30分钟,若会话空闲超过5分钟,系统将自动释放资源。业界认为,这一突破性速度将大幅降低超大规模模型在实时交互场景中的应用门槛。

原创文章,作者:XIAOMI,如若转载,请注明出处:https://www.kejixun.co/article/754618.html

XIAOMI的头像XIAOMI认证作者

相关推荐

发表回复

登录后才能评论