阿里10个团队耗时8个月，重磅开源深度研究智能体Tongyi DeepResearch_日常知识

阿里10个团队耗时8个月，重磅开源深度研究智能体Tongyi DeepResearch

创始人

2025-09-19 19:18:28

0次

2025年8月，阿里通义有个Github开源多模态深度研究项目叫WebAgent，官方项目图里有5个小豹子，刚好组成一个篮球队。

2025年9月17日，WebAgent项目改名为Tongyi DeepResearch又连发6篇论文，项目图里因此增加了6个更酷的小豹子。至今阿里Deep Research的智能体家族总共11个小豹子，刚好可以从之前的篮球队改行凑成一支足球队。

通常Github开源AI项目中，一个项目对应一篇论文，阿里的这个Tongyi DeepResearch项目竟然足足发了11篇论文，可以看出阿里对这个深度研究项目的投入和重视远超其他AI项目。

这11篇论文，1-5是之前发的，6-11是9月17日同时发布的，一起看看9月17日发的6篇分别讲了什么重点。：

No.6 WebResearcher

WebResearcher框架，通过IterResearch迭代研究范式解决了传统AI研究代理"信息积累导致推理能力下降"的核心问题。该系统像人类研究者一样定期整理发现、重建工作空间，在多个权威基准测试中显著超越现有方案。

No.7 WebResummer

阿里团队针对大语言模型智能代理在复杂网络搜索中的语境窗口限制问题，提出了ReSum无限探索范式。该方案通过定期摘要压缩对话历史、专门训练的摘要工具ReSumTool-30B和强化学习算法ReSum-GRPO，实现了4.5%-8.2%的性能提升，让AI能够处理需要大量多轮搜索验证的复杂查询任务。

No.8 WebWeaver

WebWeaver框架，让AI智能体能够像人类研究员一样进行深度调研。通过规划师和写作者的双智能体配合，实现了动态研究计划调整和分段式报告撰写，在多个基准测试中取得最佳成绩。

No.9 WebSailor-V2

研究展示了如何通过创新的合成数据构建和双环境强化学习方法，让30B参数的开源智能体在网络研究任务上达到甚至超越大型闭源系统的性能。WebSailor-V2在多个基准测试中创造了开源智能体的新纪录。

No.10 AgentFounder

阿里团队提出智能体持续预训练新方法，开发出AgentFounder-30B模型，通过在预训练和后训练间插入专门阶段解决传统智能体训练的优化冲突问题。该模型在十个基准测试中取得领先成绩，其中在HLE上达到31.5%成为首个突破30分的开源模型。

No.11 AgentScaler

团队通过创新的环境扩展方法，成功训练出AgentScaler系列AI智能体模型。该研究首次实现了小参数模型在工具使用任务上媲美大型模型的突破，其中30B参数的模型甚至能与万亿参数模型竞争。研究采用两阶段训练策略，先进行通用技能培养，再进行专业领域训练。

至顶AI实验室洞见

总的来说，Tongyi DeepResearch6个最新的研究分别解决“研究能力、记忆管理、知识整合、训练数据、推理效率与环境扩展”六大关键问题：1.AgentFounder 作为“研究大脑”，通过持续预训练为模型注入智能体直觉，奠定多步推理与工具调用基础；2.AgentScaler扮演“技能教练”，利用千级虚拟环境的两阶段训练，让小参数模型也能精通成千上万种工具；3.WebResearcher 是“迭代研究引擎”，以 Think–Report–Action 循环替代线性堆料，保证长程推理始终处于“清洁工作台”；4.ReSum 充当“记忆压缩器”，在超长搜索对话中定时生成关键线索摘要，实现语境窗口的“无限续航”；5.WebWeaver 是“双角色课题组”，规划师动态调整研究路线，写作者分段产出报告，形成类人深度调研闭环；6.WebSailor-V2 作为“数据与训练工厂”，通过 SailorFog-QA-V2 合成数据与双环境强化学习，为整个系统提供高质量、可扩展的训练燃料，并验证小模型也可比肩闭源大模型。

六大模块环环相扣：AgentScaler 与 WebSailor-V2 负责“练本领”，AgentFounder 提供“通用脑”，WebResearcher 与 WebWeaver 负责“做研究”，ReSum 保障“记得住”，共同支撑起DeepResearch 在开源领域媲美商业闭源系统的深度研究能力。

再看看每一篇的论文作者，会发现有一个名字重复出现：Jingren Zhou，也就是阿里副总裁、通义实验室负责人周靖人，也是最顶尖开源模型Qwen背后那个低调的男人。

从现在的时间点回想，也许在7月左右的一个普通上午，杭州某会议室里周靖人一声令下，6个团队的负责人带领着各自的团队投入研发，相约在9月带着各自的成果汇合。6个团队浴血奋战两个月，9月17日，Tongyi DeepResearch重磅发布！

（注：前边“7月左右”这个时间节点是本文作者推断出来的，因为WebSailor和WebSailor V2一作是同一个人，很可能是在7月第一个项目发布后立马投入V2的工作。）

Tongyi DeepResearch项目从25年1月的WebWalker开始，凝聚近10个团队8个月的心血，将一套完整的Agent系统开源给全球的开发者、企业，对全球深度研究Agent领域的发展影响深远。

项目地址：https://github.com/Alibaba-NLP/DeepResearch

模型地址：https://modelscope.cn/models/iic/Tongyi-DeepResearch-30B-A3B

END

本文来自至顶AI实验室，一个专注于探索生成式AI前沿技术及其应用的实验室。致力于推动生成式AI在各个领域的创新与突破，挖掘其潜在的应用场景，为企业和个人提供切实可行的解决方案。

Q&A

Q1：阿里通义WebAgent项目为什么改名为Tongyi DeepResearch？

A：阿里在2025年9月17日将WebAgent项目更名为Tongyi DeepResearch，并同时发布了6篇新论文，使项目论文总数达到11篇。改名后，项目图标增加了6个小豹子，总数变为11个，象征从篮球队转变为足球队，体现了项目规模的扩大和研究的深化。

Q2：Tongyi DeepResearch项目发布了哪些论文？

A：Tongyi DeepResearch项目共发布了11篇论文，分为两组：1-5篇是早期发布的，6-11篇是2025年9月17日同时发布的。论文主题涵盖网络遍历、自主信息搜索、数据合成、视觉语言研究等，例如WebWalker、WebDancer、WebResearcher等，展示了阿里在深度研究智能体领域的全面投入。

Q3：Tongyi DeepResearch的6篇新论文解决了哪些问题？

A：新发布的6篇论文分别解决了研究能力、记忆管理、知识整合、训练数据、推理效率与环境扩展等关键问题。例如，WebResearcher通过迭代研究范式提升推理能力，ReSum优化了语境窗口限制，WebWeaver实现了动态调研和报告撰写，这些创新显著提升了智能体的性能。

能力 Tongyi 模型训练深度 ReSum 重磅研究智能阿里智能体论文

上一篇：原创董军发统一强音，不到24小时，美媒放出消息，特朗普叫停对台军援

下一篇：1分钟辅助挂!钱塘十三水如何拿好牌(辅助挂)确实有挂辅助挂(详细透视软件教程)

阿里10个团队耗时8个月，重磅开源深度研究智能体Tongyi DeepResearch

相关内容

热门资讯