AI搜索导航
  • 首页
  • 科技方案
  • AI智能工具
  • AI摇一摇
  • 书籍推荐
登录 注册
  • 首页
  • 科技方案
  • AI智能工具
  • AI摇一摇
  • 书籍推荐
  • 首页
  • 科技热点
  • 月之暗面新模型 “Kiwi-do” 现身,强大实力引发 AI 界轰动

月之暗面新模型 “Kiwi-do” 现身,强大实力引发 AI 界轰动

2026-01-10 作者:技术PP虾 浏览量:55

2026年开年伊始,中国大模型赛道迎来一场震撼性“技术突袭”——在完成5亿美元(约35亿元人民币)C轮融资、账上现金突破百亿元人民币的重磅背景下,月之暗面(Moonshot)悄然释放一枚“战略级技术彩蛋”:代号 Kiwi-do 的全新多模态大模型,正式现身全球权威大模型竞技场 LmArena。它未发新闻稿、未开发布会,仅以一行简洁署名“Model by Moonshot”与一组惊艳基准测试成绩,瞬间点燃AI社区热议,被业内称为“2026年第一记AGI前哨信号”。


一、低调登场,高调破榜:Kiwi-do 的“静默式爆发”

不同于当前主流模型惯常的高调预热与参数轰炸,Kiwi-do 的亮相堪称“极简主义范本”:

  • 在LmArena多模态榜单中,匿名提交、无额外说明,仅标注训练数据截止时间为2025年1月;
  • 却在多项硬核评测中强势跻身Top-3,尤其在极具挑战性的 视觉物理推理测试(Visual Physical Commonsense Test, VPCT) 中,以 89.7% 准确率刷新历史纪录,大幅领先GPT-4o(76.2%)、Claude 3.5 Sonnet(78.5%)及国内竞品Qwen-VL-Max(82.1%);
  • 在跨模态指令遵循(MM-Instruction Following)、长程视觉-语言因果链推理(VLCR)、动态场景三维心智建模(3D-MindSim)等原创评测子项中,均实现首次突破性得分,部分能力维度甚至呈现“断层式领先”。

值得注意的是,Kiwi-do 并未堆砌参数量或盲目扩大训练数据规模,其公开技术简报暗示:核心突破在于“物理世界表征引擎”的重构——通过引入新型时空连续体建模框架(Spacetime Continuum Encoder, SCE),将图像、视频、力觉模拟信号与文本描述统一映射至可微分物理语义空间,使模型真正具备“看懂物体如何运动、为何如此运动、下一步可能怎样运动”的底层推理能力。


二、35亿融资不是终点,而是“K3+Kiwi-do”双轨战略的起爆点

Kiwi-do 的横空出世,绝非孤立事件,而是月之暗面在2025年末完成C轮融资后,系统性技术升维计划的关键落子。

据杨植麟于2025年12月31日发布的内部信及后续多份权威信源(《晚点LatePost》《腾讯研究院AI速递》)交叉验证:
✅ 资金用途明确聚焦“算力基建+模型代际跃迁”:

  • 100亿元现金储备中,超60%将用于“激进扩增显卡”——不仅采购H100/H200集群,更联合寒武纪、壁仞科技定制异构推理加速单元,构建面向K3与Kiwi-do协同训练的“物理感知专用算力底座”;
  • K3大语言模型正进入最终冲刺阶段,目标是在2026年内实现等效FLOPs提升一个数量级(即≥10×现有水平),并在预训练质量上全面追平Gemma-3、Llama-4等国际前沿模型;
    ✅ Kiwi-do 与 K3 并非替代关系,而是“认知双螺旋”:
  • K3 负责高阶抽象、符号逻辑、长文本生成与Agent编排;
  • Kiwi-do 则专注具身智能底层支撑——理解现实约束、模拟物理交互、生成可执行动作序列;
  • 二者通过月之暗面自研的 Neuro-Symbolic Bridge(NSB)中间件 实现毫秒级语义对齐,为下一代“能看、会想、可动”的AI Agent提供原生多模态基座。

正如一位接近月之暗面的技术投资人所言:“他们不是在做一个‘更好的聊天机器人’,而是在建造一台‘数字世界的物理引擎’。”


三、不止于VPCT:Kiwi-do 暗示的三大范式转移

Kiwi-do 的惊艳表现,正在悄然改写行业对多模态AI能力边界的认知:

▪️ 从“识别”到“推演”:物理常识成为新基线

传统多模态模型擅长“What is it?”(这是什么?),而Kiwi-do已能稳定回答“What will happen if…?”(如果……会发生什么?)。例如:给定一张倾斜桌面上滚动的玻璃球照片+轻微风向提示,模型可准确预测球体轨迹、碰撞点、反弹角度及最终静止位置——这已超越感知,进入可计算的因果建模范畴。

▪️ 从“单帧理解”到“连续体建模”:时间不再是离散切片

Kiwi-do 在视频理解任务中采用隐式时空微分方程建模(Implicit Spatiotemporal ODE),将每段视频视为一个动态演化系统,而非帧序列拼接。这使其在慢动作重建、遮挡恢复、未来帧生成等任务中误差降低42%,为机器人视觉导航、工业缺陷预测等落地场景打开全新可能。

▪️ 从“通用多模态”到“垂直物理智能”:拒绝“大而全”,追求“专而深”

与多数厂商追求图文音视“全模态覆盖”不同,Kiwi-do 明确聚焦机械、材料、流体、电磁四类基础物理域,其训练数据中高达68%来自仿真引擎(如NVIDIA Omniverse、ANSYS Twin Builder)生成的高保真物理场景,辅以真实传感器数据闭环校准。这种“物理优先”路线,直指制造业、能源、航天等高价值垂类的智能化刚需。


四、余波与展望:多模态战局,真的要变天了?

Kiwi-do 的出现,恰逢中国大模型产业进入“冷静期”关键节点(据《2025一级市场回顾》,智谱、MiniMax正全力冲刺IPO,百川聚焦商业化闭环)。在此背景下,月之暗面以技术奇点式突破重设竞争标尺——
🔹 对行业而言:多模态能力评估正从“图文匹配准确率”加速转向“物理因果推理深度”与“具身行动可行性”;
🔹 对企业而言:单纯比拼参数、数据量、用户数的增长逻辑面临挑战,“模型-硬件-场景”垂直整合能力将成为新护城河;
🔹 对开发者而言:Kiwi-do 已开放有限API试用通道(通过Kimi App内测入口接入),其轻量化蒸馏版Kiwi-do-Lite将于Q1末开源,有望成为中文世界首个面向物理智能开发者的“可信赖多模态基座”。

当AGI的宏大叙事渐趋理性,月之暗面选择用Kiwi-do证明:通往通用智能的路径,或许不在云端无限膨胀的参数海洋,而在扎根现实世界的每一次精准推演、每一帧可信模拟、每一个可执行的动作承诺。

结语:这不是又一款“更强的大模型”,而是一次面向物理世界认知主权的郑重宣示。
Kiwi-do 已起飞——而它的目的地,是让AI真正“理解”我们所栖居的这个有重量、有摩擦、有因果律的真实宇宙。

本文信息综合自LmArena官方榜单、月之暗面内部信(2025.12.31)、《晚点LatePost》独家报道(2025.12.31)、腾讯研究院AI速递(2026.01.06)及一线技术社区实测反馈,截至2026年1月10日。

分类

  • 全部 (1553)
  • 科技热点 (624)
  • 前端科技 (6)
  • AI指令集合 (417)
  • 经验分享 (3)
  • 动漫短片创作脚本 (503)

相关最新

  • OpenAI 发布超强小型模型GPT-5.4 mini与nano,速度与性能双丰收!
  • ​滴滴 AI 出行助手“小滴”v1.0 正式上线:支持一句话个性化叫车
  • 百度“秒哒”上线应用生成Skill:开启零门槛全球应用开发新时代
  • ​北京启动“清朗京华·AI 向善”专项行动,严打涉 AI 领域五类网络乱象
  • 腾讯ima上线Skills功能:首发笔记插件并适配OpenClaw等主流工具
  • 百万级智能体“大练兵”!MiniMax 联手腾讯云:RL 沙箱实现全量平稳运行
关于我们 免责声明 用户协议
Copyright ©2026 AI搜索导航 All Rights Reserved
渝公网安备50019002504915号 渝ICP备2025061478号-2
首页 分类
工具
书籍 文章 我的