钉钉AI实现基准与实际应用落地双重突破
创始人
2025-11-12 16:44:14
0

近日,由钉钉团队研发的深度研究系统“Dingtalk-DeepResearch”在DeepResearch Bench测试中以48.49分位列全球第二,国内第一。

该系统已成功应用于制造业、供应链等复杂场景,能够在复杂异构表格、多阶段推理与多模态生成任务中保持行业领先的准确性和稳健性,帮助企业高效处理多模态数据,实现智能升级。

Dingtalk-DeepResearch设计了一种面向真实企业场景的多智能体深度研究框架,将深度研究生成、异构表格解析与推理、多模态报告生成有效整合在同一系统中。通过三层架构设计(任务导向的智能体层、核心引擎层、数据层),能够支撑对复杂任务的并行处理与多阶段推理。

为应对企业场景的动态变化,该框架区别于传统静态架构,通过熵引导、记忆感知的在线学习机制使智能体能够持续演进。该机制保障系统能自动从历史交互中归纳经验,逐步适应不同企业的业务流程与用户操作风格。

例如,当用户多次修改AI输出的报告格式后,系统会自主学习并记忆用户对格式、风格及关键点的偏好,在后续生成中主动对齐用户需求。在钉钉企业级AI平台中,这种经个性化调优的偏好可以作为一种能力沉淀并共享给团队乃至整个公司,实现组织知识的复用与增效。

为确保生成内容的准确性与可靠性,Dingtalk-DeepResearch内置了DingAutoEvaluator评估系统,对生成的每一份报告进行多维度“质量检验”。一旦发现问题,系统会自动将相关案例反馈至训练流程以优化模型,形成一套从生成、评估到优化的持续改进闭环。

目前,Dingtalk-DeepResearch已在多个真实业务场景中稳定应用并创造价值。在供应链领域,系统能快速分析跨部门的复杂表格数据,为采购策略提供智能化建议;在制造业,它能将设备运行的原始数据自动转化为可视化分析报告,为故障预测与维护提供决策支持。所有核心功能均通过国际基准测试验证,确保了技术的可靠性与领先性。

钉钉CTO朱鸿表示,“Dingtalk-DeepResearch通过结合自适应优化和多模态推理,形成一个可灵活部署的企业级AI框架,旨在处理复杂且不断演进的真实业务任务。该技术正加速在AI搜索、AI表格、自动化工作流、Agent平台等产品中落地,让前沿AI技术更贴近实际生产需求,为企业提供真正创造价值的AI。”(李京)

来源:光明网

相关内容

热门资讯

2025年热贡文化唐蕃古道行兰... 本文转自:人民网-青海频道黄河之约·金城相会2025年热贡文化唐蕃古道行兰州站农文旅商推介活动启幕黄...
《徐霞客游记》中两次提及的报恩... 从大理市区到鸡足山虽然有点远,但这座曾被徐霞客在他的游记中两次提及的报恩寺的吸引力也是显而易见的。不...
崇明的海风吹进浦江东岸,足不出... 这个周末,来自崇明的海风,吹进了浦江东岸,邀请都市人足不出“沪”,体验另一种“向往的生活”。12月2...
崇明文旅推介嘉年华亮相浦东前滩... 今天(12月27日),“域见上海 申爱崇明”崇明文旅推介嘉年华在浦东新区前滩公园巷举行。现场,近70...
抖音2025文旅报告揭晓!万岁... 12月24日抖音生活服务发布《2025文旅数据报告》郑州入选全国十大热门旅游城市洛阳、开封跻身全国十...
2025「Ai+消费品」日常生... “AI+消费品”是将生成式AI、计算机视觉等技术作为核心功能的产品,主要面向普通消费者。其发展历经“...
城市徒步新玩法!徐家汇“博物行... 徐家汇商圈 “如今看到的徐家汇空中连廊于2024年竣工,简洁雅致的造型和通透的结构,将连廊巧妙融入商...
人类基准测试大翻车:样本不足、... 我们经常在一些对比 AI 性能的测试中,看到宣称基础模型在自然语言理解、推理或编程任务等性能超人类的...
员工被AI替代遭解雇,公司做法... 员工被AI替代遭解雇,公司做法是否违法?北京劳动人事争议仲裁委员会:认定公司违法解除劳动合同 (来源...
博鳌藏着中国最奇出海口:河海被... 2025年12月27日的清晨,琼海博鳌的海风带着咸湿的暖意,掠过三江交汇的水面。万泉河从五指山奔涌而...