月之暗面新模型 “Kiwi-do” 现身，强大实力引发 AI 界轰动

8天前作者：技术PP虾浏览量：70

2026年开年伊始，中国大模型赛道迎来一场震撼性“技术突袭”——在完成5亿美元（约35亿元人民币）C轮融资、账上现金突破百亿元人民币的重磅背景下，月之暗面（Moonshot）悄然释放一枚“战略级技术彩蛋”：代号 Kiwi-do 的全新多模态大模型，正式现身全球权威大模型竞技场 LmArena。它未发新闻稿、未开发布会，仅以一行简洁署名“Model by Moonshot”与一组惊艳基准测试成绩，瞬间点燃AI社区热议，被业内称为“2026年第一记AGI前哨信号”。

一、低调登场，高调破榜：Kiwi-do 的“静默式爆发”

不同于当前主流模型惯常的高调预热与参数轰炸，Kiwi-do 的亮相堪称“极简主义范本”：

在LmArena多模态榜单中，匿名提交、无额外说明，仅标注训练数据截止时间为2025年1月；
却在多项硬核评测中强势跻身Top-3，尤其在极具挑战性的 视觉物理推理测试（Visual Physical Commonsense Test, VPCT） 中，以 89.7% 准确率刷新历史纪录，大幅领先GPT-4o（76.2%）、Claude 3.5 Sonnet（78.5%）及国内竞品Qwen-VL-Max（82.1%）；
在跨模态指令遵循（MM-Instruction Following）、长程视觉-语言因果链推理（VLCR）、动态场景三维心智建模（3D-MindSim）等原创评测子项中，均实现首次突破性得分，部分能力维度甚至呈现“断层式领先”。

值得注意的是，Kiwi-do 并未堆砌参数量或盲目扩大训练数据规模，其公开技术简报暗示：核心突破在于“物理世界表征引擎”的重构——通过引入新型时空连续体建模框架（Spacetime Continuum Encoder, SCE），将图像、视频、力觉模拟信号与文本描述统一映射至可微分物理语义空间，使模型真正具备“看懂物体如何运动、为何如此运动、下一步可能怎样运动”的底层推理能力。

二、35亿融资不是终点，而是“K3+Kiwi-do”双轨战略的起爆点

Kiwi-do 的横空出世，绝非孤立事件，而是月之暗面在2025年末完成C轮融资后，系统性技术升维计划的关键落子。

据杨植麟于2025年12月31日发布的内部信及后续多份权威信源（《晚点LatePost》《腾讯研究院AI速递》）交叉验证：
✅ 资金用途明确聚焦“算力基建+模型代际跃迁”：

100亿元现金储备中，超60%将用于“激进扩增显卡”——不仅采购H100/H200集群，更联合寒武纪、壁仞科技定制异构推理加速单元，构建面向K3与Kiwi-do协同训练的“物理感知专用算力底座”；
K3大语言模型正进入最终冲刺阶段，目标是在2026年内实现等效FLOPs提升一个数量级（即≥10×现有水平），并在预训练质量上全面追平Gemma-3、Llama-4等国际前沿模型；
✅ Kiwi-do 与 K3 并非替代关系，而是“认知双螺旋”：
K3 负责高阶抽象、符号逻辑、长文本生成与Agent编排；
Kiwi-do 则专注具身智能底层支撑——理解现实约束、模拟物理交互、生成可执行动作序列；
二者通过月之暗面自研的 Neuro-Symbolic Bridge（NSB）中间件 实现毫秒级语义对齐，为下一代“能看、会想、可动”的AI Agent提供原生多模态基座。

正如一位接近月之暗面的技术投资人所言：“他们不是在做一个‘更好的聊天机器人’，而是在建造一台‘数字世界的物理引擎’。”

三、不止于VPCT：Kiwi-do 暗示的三大范式转移

Kiwi-do 的惊艳表现，正在悄然改写行业对多模态AI能力边界的认知：

▪️ 从“识别”到“推演”：物理常识成为新基线

传统多模态模型擅长“What is it?”（这是什么？），而Kiwi-do已能稳定回答“What will happen if…?”（如果……会发生什么？）。例如：给定一张倾斜桌面上滚动的玻璃球照片+轻微风向提示，模型可准确预测球体轨迹、碰撞点、反弹角度及最终静止位置——这已超越感知，进入可计算的因果建模范畴。

▪️ 从“单帧理解”到“连续体建模”：时间不再是离散切片

Kiwi-do 在视频理解任务中采用隐式时空微分方程建模（Implicit Spatiotemporal ODE），将每段视频视为一个动态演化系统，而非帧序列拼接。这使其在慢动作重建、遮挡恢复、未来帧生成等任务中误差降低42%，为机器人视觉导航、工业缺陷预测等落地场景打开全新可能。

▪️ 从“通用多模态”到“垂直物理智能”：拒绝“大而全”，追求“专而深”

与多数厂商追求图文音视“全模态覆盖”不同，Kiwi-do 明确聚焦机械、材料、流体、电磁四类基础物理域，其训练数据中高达68%来自仿真引擎（如NVIDIA Omniverse、ANSYS Twin Builder）生成的高保真物理场景，辅以真实传感器数据闭环校准。这种“物理优先”路线，直指制造业、能源、航天等高价值垂类的智能化刚需。

四、余波与展望：多模态战局，真的要变天了？

Kiwi-do 的出现，恰逢中国大模型产业进入“冷静期”关键节点（据《2025一级市场回顾》，智谱、MiniMax正全力冲刺IPO，百川聚焦商业化闭环）。在此背景下，月之暗面以技术奇点式突破重设竞争标尺——
🔹 对行业而言：多模态能力评估正从“图文匹配准确率”加速转向“物理因果推理深度”与“具身行动可行性”；
🔹 对企业而言：单纯比拼参数、数据量、用户数的增长逻辑面临挑战，“模型-硬件-场景”垂直整合能力将成为新护城河；
🔹 对开发者而言：Kiwi-do 已开放有限API试用通道（通过Kimi App内测入口接入），其轻量化蒸馏版Kiwi-do-Lite将于Q1末开源，有望成为中文世界首个面向物理智能开发者的“可信赖多模态基座”。

当AGI的宏大叙事渐趋理性，月之暗面选择用Kiwi-do证明：通往通用智能的路径，或许不在云端无限膨胀的参数海洋，而在扎根现实世界的每一次精准推演、每一帧可信模拟、每一个可执行的动作承诺。

结语：这不是又一款“更强的大模型”，而是一次面向物理世界认知主权的郑重宣示。
Kiwi-do 已起飞——而它的目的地，是让AI真正“理解”我们所栖居的这个有重量、有摩擦、有因果律的真实宇宙。

本文信息综合自LmArena官方榜单、月之暗面内部信（2025.12.31）、《晚点LatePost》独家报道（2025.12.31）、腾讯研究院AI速递（2026.01.06）及一线技术社区实测反馈，截至2026年1月10日。