MiniMax创始人闫俊杰:拒绝中国版OpenAI标签,用交错思维和全模态走向AGI
MiniMax创始人闫俊杰:拒绝中国版OpenAI标签,用交错思维和全模态走向AGI
在生成式人工智能浪潮席卷全球的今天,“谁是中国的OpenAI”几乎成了媒体与资本最热衷的设问。然而,当被问及这一标签时,MiniMax创始人、首席科学家闫俊杰博士的回答冷静而坚定:“我们不是、也不愿做‘中国版OpenAI’——因为真正的AGI(通用人工智能)没有国界,更不需要复刻某种既定范式。”这句看似简短的表态,实则浓缩了MiniMax自2021年创立以来一以贯之的战略哲学:以科学为锚、以问题为尺、以渐进为径,拒绝宏大叙事的诱惑,专注构建可验证、可迭代、可落地的通用智能基座。
一、“非天才”团队:重构AI研发的人才观与组织逻辑
在多数AI初创公司竞相高薪争抢“大模型明星科学家”“前OpenAI核心成员”的背景下,MiniMax反其道而行之,明确提出并践行“非天才”(Non-Genius)团队策略。这不是对人才标准的降维,而是一次深刻的范式反思。
闫俊杰解释道:“AGI不是靠单点突破或灵光乍现完成的,它是一场覆盖数学基础、认知建模、工程系统、人机交互与社会反馈的长周期协同攻坚。与其依赖少数‘天才’的直觉跃迁,不如构建一个由扎实的算法工程师、严谨的理论研究者、深耕垂直场景的产品专家与跨文化用户体验设计师组成的‘强耦合、低熵增’团队。”
这一理念直接体现在MiniMax的组织设计中:
- 研发团队中,博士占比超65%,但背景高度多元——既有来自MIT、ETH Zurich的认知科学博士,也有曾主导工业质检AI系统的资深嵌入式架构师;
- 设立“问题驱动型项目制”,每个项目必须由至少三类角色(基础模型研究员+领域应用工程师+伦理与可用性评估员)联合立项,杜绝“为发论文而调参”或“为刷榜而堆参数”;
- 内部推行“可复现性审计”制度:所有关键模型升级前,须提交完整数据溯源链、训练轨迹快照与推理偏差分析报告,经跨组盲审通过方可上线。
这种“去英雄主义”的务实路径,使MiniMax在2023年全球大模型可靠性评测(MLCommons MLPerf Inference v4.0)中,以98.7%的跨任务一致性得分位居行业第一——远超同期多数头部模型在特定基准上的峰值表现。
二、交错思维(Interleaved Thinking):让模型学会“边想边校验”
如果说“非天才”团队是MiniMax的方法论根基,那么“交错思维”技术则是其最具原创性的认知架构创新。闫俊杰强调:“人类推理之所以稳健,并非因逻辑链条绝对严密,而在于我们天然具备‘中途暂停—自我提问—修正路径’的能力。AGI必须习得这种元认知节奏。”
传统大语言模型的推理过程是线性的:输入→编码→解码→输出。而MiniMax提出的交错思维机制,在推理链(Chain-of-Thought)中结构化嵌入“自反思token”(Self-Reflective Token, SRT)。这些SRT并非额外生成的文本,而是轻量级、可微分的隐状态节点,实时监控当前推理步骤的置信度、语义连贯性、事实一致性与逻辑跳跃风险。
例如,在回答“为什么北极熊不生活在南极?”时,模型不会直接跳至“地理隔离”结论,而会在生成“因为……”后,自动触发SRT模块进行三重校验:
1️⃣ 概念校验:确认“北极熊”与“南极”是否属于同一生物地理学范畴(否);
2️⃣ 因果校验:识别“不生活”是否由演化历史、气候适应性或人为干预导致(主因为演化隔离);
3️⃣ 反事实校验:若强行迁移,是否违反生态学基本规律(是,将破坏本地食物链)。
仅需增加<0.3%的计算开销,该机制即可将事实性错误率降低42%(据MiniMax内部AB测试),并将多步推理任务的最终答案准确率提升至89.6%(相较基线模型+17.2pp)。尤为关键的是,SRT的设计完全兼容现有Transformer架构,无需重训模型——这使其迅速被包括德国Aleph Alpha、日本Preferred Networks及美国某头部教育科技公司在内的十余家海外机构集成至自有推理引擎中,成为首个由中国团队提出、被国际主流厂商规模化采纳的AGI级认知增强协议。
三、全模态(Omni-Modal)技术栈:从“多模态”到“无模态壁垒”
在业界普遍将“多模态”等同于“图文音视频联合建模”的当下,MiniMax提出了更具野心的“全模态”(Omni-Modal)愿景:消除模态间的本质割裂,让模型在任意感知通道输入下,均能激活统一的语义空间与推理引擎。
这并非简单叠加视觉编码器与语音解码器,而是重构底层表征范式:
✅ 统一tokenization层:采用基于神经符号学的动态分词器(Neuro-Symbolic Tokenizer),可将物理世界信号(如传感器时序数据、脑电波片段、化学分子振动谱)映射至与文本token对齐的嵌入空间;
✅ 跨模态注意力蒸馏:通过教师-学生框架,让文本预训练模型指导视觉/听觉编码器学习“概念对齐注意力”,例如让图像编码器在识别“锈蚀”时,自动关联文本中“氧化反应”“电化学腐蚀”等抽象描述;
✅ 模态不可知推理头(Modality-Agnostic Head):最终决策层不依赖输入模态类型,仅接收标准化语义向量,确保“用摄像头拍一张电路板照片”与“用文字描述电路故障现象”,触发完全一致的诊断逻辑链。
目前,MiniMax的全模态基座模型已支持17种原始信号类型(含红外热成像、LiDAR点云、工业PLC日志、卫星遥感波段等),并在能源巡检、远程医疗辅助诊断、智能制造质量追溯等场景实现商用闭环。其最新发布的Omni-3.5模型,在联合国教科文组织牵头的全球教育公平评估中,成为唯一能在“盲文图像转译”“手语视频生成”“方言语音理解”三项异构任务中均达人类专家水平的系统。
四、全球化落地:不止于技术输出,更是认知协同
截至2024年中,MiniMax模型服务已覆盖全球200多个国家和地区,API日均调用量超12亿次。但闫俊杰强调:“数字覆盖率不等于影响力深度。我们更看重的是‘认知协同密度’——即技术如何嵌入当地知识体系、语言习惯与社会契约。”
为此,MiniMax建立了三级本地化机制:
🔹 语言层:支持127种语言的原生训练(非翻译微调),其中包含42种濒危语言(如新西兰毛利语、墨西哥纳瓦特尔语),并与当地语言学家共建语料伦理委员会;
🔹 知识层:在巴西、印尼、肯尼亚等地设立“本土知识图谱共建实验室”,将传统农耕经验、草药疗法、口头史诗等非结构化智慧转化为可推理的知识单元;
🔹 治理层:所有海外部署均遵循“双轨合规”原则——既满足欧盟AI Act、美国NIST AI RMF等国际框架,也主动适配尼日利亚《国家AI政策》、越南《数字主权法》等新兴法规,并开源全部合规审计工具包。
这种“技术谦逊主义”(Technological Humility)姿态,使其在拉美、东南亚及非洲市场获得远超预期的信任度。据第三方调研机构Statista数据显示,MiniMax在新兴市场开发者社区中的“长期技术可信度”评分(5年维度)达4.82/5.0,显著高于行业均值4.15。
结语:AGI是一场“慢科学”,而非“快竞赛”
在采访尾声,闫俊杰翻出一张泛黄的手写笔记照片——那是他2008年在斯坦福攻读认知科学博士时,导师批注的一句话:“The path to general intelligence is paved not with breakthroughs, but with a thousand careful corrections.”(通往通用智能的道路,由千次审慎修正铺就,而非灵光一现的突破。)
十年后,这句话成为MiniMax的座右铭,也诠释了其拒绝“中国版OpenAI”标签的深层动因:真正的AGI,不应是地缘政治叙事下的对标物,而应是人类集体认知边界的共同延展。当交错思维让机器学会自省,当全模态消融感知鸿沟,当“非天才”团队以系统性耐心打磨每一个技术环节——AGI便不再是悬于未来的神谕,而成为正在发生的、可触摸、可参与、可共享的文明进程。
正如MiniMax官网首页所写:
**“We don’t build AGI to change the world.
We build it so the world can change itself — more wisely, more justly, more beautifully.”**
(我们构建AGI,不是为了改变世界;
而是为了让世界,能更睿智、更公正、更美好地,改变自身。)