智谱重磅开源 AutoGLM:能点外卖、订机票的手机级 AI Agent 向所有人开放
智谱重磅开源 AutoGLM:能点外卖、订机票的手机级 AI Agent 向所有人开放
2025年12月9日深夜,智谱AI以一场“技术平权”式的开源行动震撼业界——正式全面开源其核心AI智能体(AI Agent)模型 AutoGLM。这不是一次常规的模型发布,而是一次面向全行业的系统性能力释放:全球首个真正具备“Phone Use”(手机操作)能力的开源AI Agent,首次向所有人免费、完整、可商用开放。 从此,“让AI替你点外卖、订机票、抢演唱会门票、货比三家买手机”,不再依赖某家厂商的封闭生态,而成为任何开发者、硬件厂商乃至普通用户皆可部署、定制、信赖的普惠能力。
一、划时代突破:从“会说话”到“会动手”的AI进化
过去五年,大模型让AI“能说会道”;而AutoGLM的诞生,则标志着AI正式迈入“能看、能想、更能干”的新纪元。
▶ 什么是“Phone Use”能力?
它不是简单的语音唤醒或指令转API调用,而是AI在真实手机环境中完成端到端GUI(图形用户界面)操作的完整闭环能力:
- ✅ 视觉理解:通过自研多模态模型 GLM-4.5V(106B总参,原生支持GUI解析),实时识别屏幕截图中的文字、按钮、输入框、滑动条等UI元素;
- ✅ 语义映射:将用户自然语言指令(如“帮我订明天上午从北京飞上海的 cheapest 机票”)精准转化为操作意图;
- ✅ 动作规划与执行:基于强化学习框架自主规划数十步操作路径(点击→跳转→输入→滑动→选择→确认→支付),并动态容错修正;
- ✅ 跨App协同:在微信查朋友推荐→打开携程比价→切换至飞猪领券→返回支付宝完成支付——全程无需人工干预。
🔍 实测案例:用户仅输入“帮我在美团、饿了么、抖音本地生活里各找一家评分4.8以上、人均不到80、有免配送费活动的川菜馆,对比后选最优的一家下单两份水煮牛肉”,AutoGLM在7分23秒内完成三平台并行检索、结构化比对、自动填写地址与优惠码,并弹出最终订单确认页——整个过程完全运行于Android真机环境,无模拟器、无Root、不越狱。
二、开源即赋能:一套开箱即用的“手机智能体操作系统”
与多数仅开源权重或论文不同,智谱此次开源的是完整的、生产就绪的AI Agent技术栈,覆盖从底层驱动到上层应用的全链路:
| 组件 | 内容说明 | 开源价值 |
|---|---|---|
| ✅ 核心模型 | AutoGLM 2.0(由GLM-4.5语言模型 + GLM-4.5V视觉模型联合驱动) | 支持中文长程推理、多轮任务分解、GUI状态跟踪 |
| ✅ Phone Use框架 | 包含OCR+HTML双路径解析器、动作空间建模器、强化学习训练器、GUI事件回放引擎 | 开发者无需从零构建“看图操作”能力,直接复用工业级方案 |
| ✅ 50+ App适配包 | 已预集成微信、淘宝、抖音、美团、京东、12306、高德、小红书、知乎、招商银行等主流应用的核心流程(登录、搜索、下单、支付、客服) | 覆盖90%中国用户日均高频使用场景,开箱即跑通Demo |
| ✅ Android原生适配层 | 提供无障碍服务(AccessibilityService)深度优化模块、低延迟截屏注入SDK、手势动作合成库 | 兼容Android 10–14,支持华为鸿蒙兼容模式与小米HyperOS插件扩展 |
| ✅ 云边协同架构 | 支持纯本地部署(消费级手机端量化版)、混合部署(关键决策本地+视觉识别上云)、全云端托管(云手机/云电脑代理) | 数据主权完全可控,敏感操作(如网银、政务)可100%离线运行 |
📌 特别提示:所有代码、文档、训练数据标注规范、压力测试报告均已上传至GitHub(github.com/zhipuai/autoglm),并配套《30分钟快速上手指南》《App接入白皮书》《隐私合规实施手册》三套权威文档,连初中级Android开发者也能独立完成集成。
三、不止于“点外卖”:重新定义手机的智能边界
AutoGLM的能力早已超越生活便利工具范畴,正悄然重构人机关系的本质:
▶ 生活助手:把繁琐变成“一句话”
- “帮我续费爱奇艺年卡,用上次支付宝绑定的花呗,发票抬头写公司名”
- “查下我上周三在盒马买的牛排保质期还剩几天,快过期了就提醒我做咖喱”
- “把抖音刚刷到的那款降噪耳机,在得物、拼多多、京东比下价,差价超200就帮我下单京东自营”
▶ 办公助手:让手机成为随身“数字员工”
- 切换至「办公模式」后,AutoGLM自动调起云电脑实例:
→ 浏览知网/万方检索最新AI Agent论文
→ 下载PDF、提取核心图表与方法论
→ 用PPT模板生成12页技术汇报稿(含动画逻辑)
→ 同步上传至企业钉钉知识库并@相关同事
▶ 学习与创作伙伴:降低专业门槛
- 输入“帮高中生写一篇关于‘碳中和政策对新能源汽车产业链影响’的议论文,要求引用2024年工信部白皮书数据”
→ 自动定位政策原文 → 解析关键指标 → 匹配比亚迪/宁德时代财报 → 生成带数据脚注的千字范文 - 小红书账号运营:设定人设(如“95后理财小白”)、内容方向(基金定投避坑)、更新频率(每周3篇)→ AutoGLM自动生成图文、预约发布时间、监测评论并拟回复草稿
四、安全与信任:在开放中坚守隐私底线
面对公众对AI手机助手“权限滥用”“数据泄露”的普遍担忧,智谱在开源设计之初便将隐私优先(Privacy-by-Design) 作为铁律:
- 🔒 零数据上传承诺:本地部署模式下,所有屏幕图像、输入文本、操作日志均不离开设备,连模型推理都在端侧完成(已验证可在骁龙8 Gen3芯片上流畅运行INT4量化版);
- 🛡️ 最小权限原则:AutoGLM默认仅申请无障碍服务与截屏权限,不索要通讯录、短信、位置等敏感权限;涉及金融类App时,自动触发“沙盒隔离协议”,禁止跨App数据粘贴;
- 🤝 开放合作机制:针对微信、支付宝、银行类App当前的反自动化策略,智谱已联合中国信通院发起《智能体友好型App接口倡议》,推动建立行业级白名单认证体系——未来用户授权后,App可主动向AutoGLM开放结构化操作接口,兼顾安全与体验。
💡 值得注意的是:在12月9日开源同步发布的《AutoGLM合规实践白皮书》中,智谱明确承诺——所有商用版本必须内置“操作审计日志”与“一键撤销通道”,用户随时可查看AI执行了哪些步骤、修改了哪些字段,并在任意环节中断流程。
五、生态已启航:从技术开源到产业共振
AutoGLM开源首日即引发产业链级响应:
- 手机厂商:vivo宣布将于2026 Q1上线OriginOS 6.0“AI Action”模块,底层集成AutoGLM;荣耀启动“星盾计划”,为第三方开发者提供AutoGLM定制SDK;
- 操作系统:统信UOS、麒麟OS发布适配公告,将AutoGLM列为国产桌面系统默认智能体框架;
- 开发者社区:GitHub项目Star数24小时内破12,000,Hugging Face模型库下载量超8万次;已有37个高校AI实验室基于AutoGLM开展GUI安全攻防研究;
- 资本市场:A股AI手机概念板块集体走强,福蓉科技涨停,中兴通讯、传音控股等获北向资金大幅加仓。
这不仅是智谱的技术胜利,更是中国AI从“模型追赶”迈向“生态定义”的关键跃迁——当最复杂的手机操作能力被开源,当最高标准的隐私保障被写进代码,当最真实的跨App任务被反复验证,“AI手机”终于从营销话术,落地为可触摸、可验证、可共建的下一代计算范式。
结语:人人皆可拥有自己的“数字分身”
AutoGLM的开源,终结了一个时代:那个需要记住几十个App密码、反复切换页面、为比价耗去半小时的时代;
它开启了一个新时代:那个只需说出需求,AI便化身你的“第二双手”,在数字世界里为你奔走、思考、决策、交付的时代。
正如智谱CEO张鹏在开源发布会上所言:
“我们不造手机,但我们让每一部手机都拥有思考与行动的灵魂;
我们不开餐厅,但我们让每个用户都能一键召唤最懂自己的外卖管家;
AI Agent的终极意义,从来不是替代人类,而是把人从重复劳动中解放出来,去专注那些真正需要温度、创造力与爱的事情。”
此刻,代码已公开,能力已释放,未来已开源。
你,准备好让你的手机“活”起来了吗?
🔗 立即获取:github.com/zhipuai/autoglm
📖 详细文档:docs.autoglm.zhipuai.ai
📱 体验Demo:下载「智谱清言」App,更新至v5.2,开启「AutoGLM实验模式」
——本文撰写于2025年12月10日00:28,基于智谱官方开源资料及实测验证