智谱发布新AI Agent：会做深度研究，但还是入门级|界面新闻

界面新闻记者 | 伍洋宇
界面新闻编辑 | 文姝琪

从不久前Manus刷屏互联网开始，就不断有声音议论智谱AI的Agent会如何选择下一个迭代方向。

在此之前，智谱AI是国内第一家押注并发力AI Agent的“AI六小虎”，其AutoGLM也凭借“人类历史上第一个AI发出的红包”获得了一波热度。

再次举办发布会，智谱的确把重心放在了AI Agent上。3月31日，智谱AI在2025中关村论坛上正式发布“AutoGLM沉思”，同时具备深度研究能力（Deep Research）和实际操作（Operator），可自主打开并浏览网页，完成从数据检索、分析到生成报告。

简而言之，AutoGLM沉思约等于AutoGLM与Deep Research的结合。

Deep Research起初是由谷歌在去年底上线，但这项“Gemini with Deep Research”功能受限于Gemini当时的模型能力，并没有发挥出最好功效，反倒由OpenAI随后推出的Deep Research夺走了用户的关注与支持。

尽管OpenAI只向收费200美元/月的ChatGPT Pro用户开放，但在o1、o3等模型支持下，Deep Research仍然迅速成为了这个付费模式下的核心产品。

智谱AutoGLM沉思是国内第一个跟进深度研究能力的Agent产品，并且做到了免费、不限量。在演示视频中，它展示了在法律、教育、金融等领域的自主操作、研究及报告生成能力。

遇到模型的知识盲区时，该Agent除了搜索网页，也会自主打开浏览器等页面，基于GUI（Graphical User Interface，图形用户界面）阅读能力在小红书等内容App读取信息。

在模型底座上，智谱表示，AutoGLM沉思接入了智谱推理模型GLM-Z1-Air和基座模型GLM-4-Air0414。其中，GLM-Z1-Air性能对标DeepSeek-R1，速度最高可提升8倍，价格为后者的1/30。

具体技术演进路径方面，智谱表示AutoGLM沉思经过了“GLM-4基座模型-GLM-Z1推理模型-GLM-Z1-Rumination沉思模型-AutoGLM模型”。其中核心链路的模型和技术，智谱称将于4月14日正式开源，并于近期陆续上线。

需要指出的是，智谱当前十分强调AutoGLM沉思的初阶属性。不仅是智谱AI CEO张鹏在现场表示这是一个预览版本，核心支持Research场景。智谱AI AutoGLM技术负责人刘潇在介绍产品时，也指出其现阶段产品还有诸多不足，并在演示视频中表示它是在“Entry Level（入门级别）”处理很多繁杂的任务。

在功能实现上，它与OpenAI的Deep Research也确实存在差距。例如，在实测中，当AutoGLM沉思处于生成任务状态时，它无法进行多窗口对话，以及在任务发布阶段，它不会像OpenAI一样对用户进行反向询问，以丰富研究框架并界定结论边界。

这意味着AutoGLM沉思在产品功能层面还有更多优化空间。

不过，张鹏此次强调了智谱对于AI Agent的重视与信心。“智谱很早便布局AI Agent，甚至早过OpenAI和Anthropic。”张鹏说，智谱率先提出了Phone use（AutoGLM），也几乎与Anthropic在同一时间发布了Computer use。

在演进方向上，张鹏从技术角度指出，不仅是模型训练存在Scaling Law（规模法则），Agent也存在类似法则。“通过扩展训练时的 inference compute（推理时计算），我们观察到Agent展现出了更强的性能。”

他解释称，这背后是其自进化在线课程强化学习算法框架WebRL，通过设计由易到难的任务序列，逐步引导模型从简单场景向复杂场景过渡学习，从而提升训练效率和最终性能。

该方法模拟人类学习过程，通过动态调整任务难度，帮助模型积累基础能力后再挑战高难度任务，可以避免直接处理复杂问题时的训练不稳定。

“2025年将会是Agent应用的元年，智谱也将深度参与这一场浪潮。”张鹏说。

目前来看，综合已有模型性能水平、研究实力、产品化能力等多方面因素，智谱是当前国内在AI Agent领域跑在前列的创业公司之一。但Manus效应在前，在外接非自研模型的基础上，出色的产品设计及工程化能力也可能创造出惊艳的产品效果，这或许是智谱AutoGLM接下来面临的最大挑战。