正在阅读:

智谱发布新AI Agent:会做深度研究,但还是入门级

扫一扫下载界面新闻APP

智谱发布新AI Agent:会做深度研究,但还是入门级

智谱AutoGLM沉思是国内第一个跟进深度研究能力的Agent产品,并且做到了免费、不限量。

图片来源:智谱AI

界面新闻记者 | 伍洋宇

界面新闻编辑 | 文姝琪

从不久前Manus刷屏互联网开始,就不断有声音议论智谱AI的Agent会如何选择下一个迭代方向。 

在此之前,智谱AI是国内第一家押注并发力AI Agent的“AI六小虎”,其AutoGLM也凭借“人类历史上第一个AI发出的红包”获得了一波热度。 

再次举办发布会,智谱的确把重心放在了AI Agent上。3月31日,智谱AI在2025中关村论坛上正式发布“AutoGLM沉思”,同时具备深度研究能力(Deep Research)和实际操作(Operator),可自主打开并浏览网页,完成从数据检索、分析到生成报告。

简而言之,AutoGLM沉思约等于AutoGLM与Deep Research的结合。 

Deep Research起初是由谷歌在去年底上线,但这项“Gemini with Deep Research”功能受限于Gemini当时的模型能力,并没有发挥出最好功效,反倒由OpenAI随后推出的Deep Research夺走了用户的关注与支持。

尽管OpenAI只向收费200美元/月的ChatGPT Pro用户开放,但在o1、o3等模型支持下,Deep Research仍然迅速成为了这个付费模式下的核心产品。

智谱AutoGLM沉思是国内第一个跟进深度研究能力的Agent产品,并且做到了免费、不限量。在演示视频中,它展示了在法律、教育、金融等领域的自主操作、研究及报告生成能力。

遇到模型的知识盲区时,该Agent除了搜索网页,也会自主打开浏览器等页面,基于GUI(Graphical User Interface,图形用户界面)阅读能力在小红书等内容App读取信息。

在模型底座上,智谱表示,AutoGLM沉思接入了智谱推理模型GLM-Z1-Air和基座模型GLM-4-Air0414。其中,GLM-Z1-Air性能对标DeepSeek-R1,速度最高可提升8倍,价格为后者的1/30。 

具体技术演进路径方面,智谱表示AutoGLM沉思经过了“GLM-4基座模型-GLM-Z1推理模型-GLM-Z1-Rumination沉思模型-AutoGLM模型”。其中核心链路的模型和技术,智谱称将于4月14日正式开源,并于近期陆续上线。

需要指出的是,智谱当前十分强调AutoGLM沉思的初阶属性。不仅是智谱AI CEO张鹏在现场表示这是一个预览版本,核心支持Research场景。智谱AI AutoGLM技术负责人刘潇在介绍产品时,也指出其现阶段产品还有诸多不足,并在演示视频中表示它是在“Entry Level(入门级别)”处理很多繁杂的任务。 

在功能实现上,它与OpenAI的Deep Research也确实存在差距。例如,在实测中,当AutoGLM沉思处于生成任务状态时,它无法进行多窗口对话,以及在任务发布阶段,它不会像OpenAI一样对用户进行反向询问,以丰富研究框架并界定结论边界。 

这意味着AutoGLM沉思在产品功能层面还有更多优化空间。

不过,张鹏此次强调了智谱对于AI Agent的重视与信心。“智谱很早便布局AI Agent,甚至早过OpenAI和Anthropic。”张鹏说,智谱率先提出了Phone use(AutoGLM),也几乎与Anthropic在同一时间发布了Computer use。

在演进方向上,张鹏从技术角度指出,不仅是模型训练存在Scaling Law(规模法则),Agent也存在类似法则。“通过扩展训练时的 inference compute(推理时计算),我们观察到Agent展现出了更强的性能。 

他解释称,这背后是其自进化在线课程强化学习算法框架WebRL,通过设计由易到难的任务序列,逐步引导模型从简单场景向复杂场景过渡学习,从而提升训练效率和最终性能。

该方法模拟人类学习过程,通过动态调整任务难度,帮助模型积累基础能力后再挑战高难度任务,可以避免直接处理复杂问题时的训练不稳定。 

2025年将会是Agent应用的元年,智谱也将深度参与这一场浪潮。”张鹏说。

目前来看,综合已有模型性能水平、研究实力、产品化能力等多方面因素,智谱是当前国内在AI Agent领域跑在前列的创业公司之一。但Manus效应在前,在外接非自研模型的基础上,出色的产品设计及工程化能力也可能创造出惊艳的产品效果,这或许是智谱AutoGLM接下来面临的最大挑战。

未经正式授权严禁转载本文,侵权必究。

SEA

499
  • 海昌新材(300885.SZ):2024年年报净利润为7122.58万元
  • 新城控股(601155.SH):2024年年报净利润为7.52亿元

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

智谱发布新AI Agent:会做深度研究,但还是入门级

智谱AutoGLM沉思是国内第一个跟进深度研究能力的Agent产品,并且做到了免费、不限量。

图片来源:智谱AI

界面新闻记者 | 伍洋宇

界面新闻编辑 | 文姝琪

从不久前Manus刷屏互联网开始,就不断有声音议论智谱AI的Agent会如何选择下一个迭代方向。 

在此之前,智谱AI是国内第一家押注并发力AI Agent的“AI六小虎”,其AutoGLM也凭借“人类历史上第一个AI发出的红包”获得了一波热度。 

再次举办发布会,智谱的确把重心放在了AI Agent上。3月31日,智谱AI在2025中关村论坛上正式发布“AutoGLM沉思”,同时具备深度研究能力(Deep Research)和实际操作(Operator),可自主打开并浏览网页,完成从数据检索、分析到生成报告。

简而言之,AutoGLM沉思约等于AutoGLM与Deep Research的结合。 

Deep Research起初是由谷歌在去年底上线,但这项“Gemini with Deep Research”功能受限于Gemini当时的模型能力,并没有发挥出最好功效,反倒由OpenAI随后推出的Deep Research夺走了用户的关注与支持。

尽管OpenAI只向收费200美元/月的ChatGPT Pro用户开放,但在o1、o3等模型支持下,Deep Research仍然迅速成为了这个付费模式下的核心产品。

智谱AutoGLM沉思是国内第一个跟进深度研究能力的Agent产品,并且做到了免费、不限量。在演示视频中,它展示了在法律、教育、金融等领域的自主操作、研究及报告生成能力。

遇到模型的知识盲区时,该Agent除了搜索网页,也会自主打开浏览器等页面,基于GUI(Graphical User Interface,图形用户界面)阅读能力在小红书等内容App读取信息。

在模型底座上,智谱表示,AutoGLM沉思接入了智谱推理模型GLM-Z1-Air和基座模型GLM-4-Air0414。其中,GLM-Z1-Air性能对标DeepSeek-R1,速度最高可提升8倍,价格为后者的1/30。 

具体技术演进路径方面,智谱表示AutoGLM沉思经过了“GLM-4基座模型-GLM-Z1推理模型-GLM-Z1-Rumination沉思模型-AutoGLM模型”。其中核心链路的模型和技术,智谱称将于4月14日正式开源,并于近期陆续上线。

需要指出的是,智谱当前十分强调AutoGLM沉思的初阶属性。不仅是智谱AI CEO张鹏在现场表示这是一个预览版本,核心支持Research场景。智谱AI AutoGLM技术负责人刘潇在介绍产品时,也指出其现阶段产品还有诸多不足,并在演示视频中表示它是在“Entry Level(入门级别)”处理很多繁杂的任务。 

在功能实现上,它与OpenAI的Deep Research也确实存在差距。例如,在实测中,当AutoGLM沉思处于生成任务状态时,它无法进行多窗口对话,以及在任务发布阶段,它不会像OpenAI一样对用户进行反向询问,以丰富研究框架并界定结论边界。 

这意味着AutoGLM沉思在产品功能层面还有更多优化空间。

不过,张鹏此次强调了智谱对于AI Agent的重视与信心。“智谱很早便布局AI Agent,甚至早过OpenAI和Anthropic。”张鹏说,智谱率先提出了Phone use(AutoGLM),也几乎与Anthropic在同一时间发布了Computer use。

在演进方向上,张鹏从技术角度指出,不仅是模型训练存在Scaling Law(规模法则),Agent也存在类似法则。“通过扩展训练时的 inference compute(推理时计算),我们观察到Agent展现出了更强的性能。 

他解释称,这背后是其自进化在线课程强化学习算法框架WebRL,通过设计由易到难的任务序列,逐步引导模型从简单场景向复杂场景过渡学习,从而提升训练效率和最终性能。

该方法模拟人类学习过程,通过动态调整任务难度,帮助模型积累基础能力后再挑战高难度任务,可以避免直接处理复杂问题时的训练不稳定。 

2025年将会是Agent应用的元年,智谱也将深度参与这一场浪潮。”张鹏说。

目前来看,综合已有模型性能水平、研究实力、产品化能力等多方面因素,智谱是当前国内在AI Agent领域跑在前列的创业公司之一。但Manus效应在前,在外接非自研模型的基础上,出色的产品设计及工程化能力也可能创造出惊艳的产品效果,这或许是智谱AutoGLM接下来面临的最大挑战。

未经正式授权严禁转载本文,侵权必究。