闻乐 发自 凹非寺
量子位 | 公众号 QbitAI
先别聊什么参数、benchmark了,来看个狠活——
米版“macOS Sequoia”桌面系统(doge)。

开灵活画、用户登录、窗口管制、Dock栏缩放、Spotlight搜索、明暗显露作风、Launchpad启动台,透澈有。
还自带54个原生哄骗,洞开筹谋器能算账,洞开日期能看日子,洞开舆图能查地址,洞开备忘录能写东西,Grapher还能画3D函数图……拖一拖转一溜,挺像那么回事。

致使!还有个能真实冲浪的Safari浏览器,好你个“Aqqle”(狗头.jpg)。

要津这个系统是AI 4个小时全程无中断、无东说念主类收受,就这样一直肝出来的。
没错,用的便是主打长程任务、暧昧指示衔命,置身国产Agent第一梯队的小米MiMo‑V2.5 Pro。
小米最新发布的MiMo‑V2.5系列,包含Pro旗舰Agent、全模态基座、TTS语音合成、ASR语音识别四大模子,概括实力对标国际顶尖水准。
就在今天凌晨,MiMo-V2.5系列模子(包含base版)还是肃穆官宣开源,权重全量开放。
4个月,从入场到插足开源第一梯队,小米这位“超速”选手,咱得扒一扒。
国际顶模的饭桌,它坐上去了先望望成绩单。
最初,新一代模子在通用智能体智商、复杂软件工程与长程任务三大中枢维度,相较前代MiMo-V2-Pro已毕权贵跃升。
国际竞技场上,在Coding Agent、SWE-Bench Pro、GDPVal-AA等多项巨擘基准测试中成绩濒临Claude Opus 4.6、GPT-5.4等顶尖闭源模子,致使大幅高出Gemini 3.1 Pro。
这样看下来,MiMo‑V2.5-Pro不仅置身国产开源第一梯队,况兼还是跟Claude Opus 4.6、GPT-5.4等国际顶模坐在一张桌子上吃饭了。
要说划个重心,小米此次升级,最主要的是长周期任务和暧昧指示衔命智商。
官方数据显露,它不错褂讪复古超千次器具调用的长周期任务,自主完成东说念主类众人数天致使数周的高难度责任。
就拿北大SysY技俩来说,从零写一个竣工编译器这种级别的复杂工程,MiMo‑V2.5-Pro我方吭哧吭哧就能重新肝到尾,词法分析、语法分析、中间代码生成、RISC-V后端、性能优化……全包。
4.3小时、672次器具调用,任务中间都能不崩、不跑偏、不失忆,拿到233/233的满分。
还有个事儿必须提一嘴——Token着力。
在ClawEval圭臬Agent任务中,MiMo单轨迹只用约7万Token,就能达到64%的Pass³通过率。
而Claude Opus 4.6、Gemini 3.1 Pro、GPT-5.4,多半在12-18万Token。
雷同的智商,一样的成果,MiMo告成省了40%-60%的资本。
这“Token半功倍”实打实的省钱智商,咱还真得点个赞。
不单代码强,小米模子的语音智商也皆活了。
V2.5眷属里的TTS支抓文本描画造音色、零样本克隆,毋庸上传参考音频,告成用翰墨描画就能生成思要的声线;
视频地址:https://mp.weixin.qq.com/s/TX5_KfchdvfWGd0iltwcdw
ASR拿到中英SOTA,粤语、川语、吴语、闽南语都能识别,连带伴奏的歌词都能精确转写。
况兼,MiMo-V2.5-Pro和MiMo-V2.5都标配了1M高下文窗口,音频模子也大幅进化,从基座到TTS、ASR全栈升级,一个不落。
好好好,小米这波根柢不是单点解围,这是告成端出了一整套Agent全家桶啊……
那它到底有多能跑?咱上实测!
实测,真不虚!必须得来扒一下开始阿谁macOS系统的代码层,毕竟成果是真行。
扫数这个词技俩由React 18+TypeScript+Zustand+Tailwind CSS以及Vite构建,68个组件撑起了54个原生哄骗。
XcodeApp内部塞了一个真实可浏览的网页引擎、包含竣工的国际象棋逻辑的小游戏,支抓3D函数绘画的Grapher等等。
窗口管制系统也不是肤浅的弹个框,作念了一套竣工的窗口气象机:拖拽、缩放、最小化、最大化、焦点切换、z-index层级管制、还复刻了macOS标志性的Traffic Lights三色灯逻辑。
4个小时,MiMo-V2.5 Pro我方把这套架构搭起来、把54个哄骗一个个填满、把窗口管制的气象同步理顺。
全程无中断、无东说念主类收受,这编程智商属实是不虚,真把东说念主类措施员给自如了。
然后,我把模子接到了龙虾里,给了一个超长指示词,让它从零成就了一个3D像素风农场模拟游戏。
什么3D场景搭建、像素作风好意思术、作物孕育系统、天气轮回、玩家交互逻辑……透澈给我塞进去。
MiMo-V2.5 Pro一齐肝下来,从架构到中枢玩法,工程量大措施多的农场给我处分了。
最终交出来的版施行感很足。画面里是三种不同颜料分歧的农场区域,外围还点缀着像素风花卉点缀氛围;
商店里能买到胡萝卜、番茄、南瓜三种作物,游戏里不仅有晴雨轮流的天气变化,还作念了及时更新的金币计数和像素常人的膂力条。
那就初始种地吧!
进游戏第一件事,先锄地。扛着锄头走到旷地上,DuangDuangDuang几下,一块耕地就出来了。
然后去商店买种子,番茄、小麦、胡萝卜……选完往兜里一揣,回到地里一颗颗种下去。
种完浇水,看着小苗苗冒头,作物进修之后会有闪光成果,这时候就能收货了,收割完再去商店卖掉,金币叮叮当当到账了~
从场景遮挡到中枢玩法,一套竣工闭环告成拉满,种地→浇水→收货→卖钱→再买种子→再种……好,轮回起来停不下,赛博种地也太上面了!!
接下来,我用MiMo-V2.5作念了一个山野作风休养系天然漫游数字手账本。
和小游戏不一样,咱此次就给了一句大口语:
帮我作念个山野作风的休养系网站,像一册旅行手账,天然、悠闲、有呼吸感,那种逃离城市走进原野的嗅觉。
没给配色、没给字体、没给布局、没给动效决策,啥都没给。
这类任务磨真金不怕火的便是暧昧指示领会了,山野到底是个啥嗅觉?休养系配色要奈何搭?
MiMo-V2.5的领会是:地面色系、手写感字体、墨水质感、以及轻柔的动画。
于是,我就获得了一个细节拉满、内容丰富的手账。
山峦布景作念视差,蜕变的时候遐迩山层拉出纵深感,画面上还飘着小粒子。鼠标一挪,轻柔光晕就跟过来了。
复选框点击还有弹跳跃画,全文蜕变的时候每个元素都是淡入淡出,氛围感满满。
致使终末的手账本还有交互功能,行囊里的装备不错象征选择,这个小假想属于不测之喜了。
没告诉它具体用什么颜料、什么字体,它我方从山野这个词里读懂了我要的氛围,自行完成了交互、视觉和动效。
这种暧昧指示衔命智商,最相宜泛泛东说念主上手,毋庸把指示词写成PRD(产物需求文档),大口语也能出好东西。
代码智商看收场,语音这块儿咱也得试试!
让MiMo-V2.5-TTS一个东说念主撑起一台戏,分别生成了三种脚色声息,年青感性女生音、中大除夜市雇主音、吃货少年音,来场减肥诡辩!
视频地址:https://mp.weixin.qq.com/s/TX5_KfchdvfWGd0iltwcdw
出来的成果嘛……各有各的味儿,绝不串戏~
终末试试ASR语音识别。
丢了一段粤语往时,转写驱散基本准确,只消终末一句的“接待来到香港”的“来”听错了,不外腹背之毛,识别度达到99.999%。
视频地址:https://mp.weixin.qq.com/s/TX5_KfchdvfWGd0iltwcdw
只可说,小米这波语音智商补皆的姿势,属实优雅。
4个月,它拿出了真东西成果看收场,终末咱聊聊这支团队。
小米AI团队这波节律,如实有点超出预期,从昨年年底V2系列进场,到当今V2.5冲到开源第一梯队,前后也就4个月时辰。
放在行业里,闲居节律基本上是8-12个月,小米格外于告成把周期砍了一半。
快也就算了,它东西还皆,旗舰、全模态、全链路语音模子连气儿全更完。
好好好,“赶工期”赶出顶尖全家桶,亦然头一趟见(doge) 。
天然了,咱用户天然看中模子智商,但性价比咱也果真很在乎。
小米此次全系升级到1M高下文,但凭借着超高Token着力,计费章程反而简化了。
1M和256K给与雷同的Credit倍率,Pro从4x降到2x,圭臬版从2x降到1x。
加上夜间再打8折(北京时辰00:00~08:00)和Token Plan用户Credits全量重置,这组合拳打下来,就俩字——
普惠。让泛泛用户和成就者都能低资施行验高阶AI智商。
这不,海外成就者偶而种草了。
期间作念得好,落地进步也得跟上。小米显然懂这个道理,于是在打折除外,又端出MiMo Orbit这个成就者扶抓野心。
这个野心分两块:
一块是百万亿Token创造者激发野心,面向AI成就者披发100万亿Token,完全免费。全球个东说念主成就者、团队、企业都能肯求参与。
况兼小米方面会厚爱评估每份肯求,按需披发,确保Token给到实在需要的东说念主手里。
另一块是面向全球新兴Agent框架,提供起步阶段的专项支抓。
非论你的框架作念到什么阶段、用户规模多大,MiMo都爽直当你的底层模子引擎。
不仅限免接入,还会处分底层适配期间的期间支抓,帮你把用户体验门槛拉低到……简直莫得门槛。
我看分解了,这是个“手牵手咱们沿途走,创造幸福的生存~”的大作为(期待.jpg)。
放在当下这个节点看,其实也不难领会——
国际上几家家底厚的模子还是把生态铺得很稳,成就者风气基本固定,其后者思挤进去并扼制易。国产模子思要站稳,速率、实力、忠诚三样不可偏废。
小米的移交很明确:用更快的迭代抢时辰,用更强的智商留用户,用真金白银裁汰民众的尝试资本。
算不算“弯说念超车”不好说,但至少立场和作为都很干脆。
至于能不可实在站稳,天然终末如故得成就者说了算,但就这份答卷来看,小米这支AI团队是真·All in。
下一个4个月,它会掏出什么呢?我先蹲一波~
体验地址:https://aistudio.xiaomimimo.com/云开体育