美团LongCat开源VitaBench2.0 打造长期动态智能体评测基准
创始人
2026-06-26 00:49:49
0

观点网讯:6月25日,美团LongCat团队正式开源VitaBench2.0,推出面向长期动态智能体的评测基准。

据介绍,VitaBench2.0是首个真实生活场景下面向长期动态用户建模的智能体评测基准,它系统性地评测大语言模型在长期、真实、动态的用户互动中个性化与主动性的能力。

信息显示,该基准系列产品此前已以外卖点餐、餐厅就餐、旅游出行三大高频场景为载体,构建了包含66个工具的交互式评测环境,为智能体在真实场景的研发应用提供基础设施。

免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。

相关内容

热门资讯

高考志愿填报莫过度迷信AI |... 学校招生计划调整、报考热度变化,任何一个变量都可能让AI给出的“答案”失效。 ▲据报道,AI似乎已...
2026 AI硬件元年|能动手... 当左手智能体、右手机器人掀起新一轮工业革新,OpenClaw、Seedance 2.0接连落地,AI...
文心升级、豆包收费,AI告别“... 6月24日,字节豆包上线了三档付费订阅:标准版68元/月、加强版200元/月、高级版500元/月,并...
AI抱团之际,探路市场再均衡 当前资金极致抱团AI和科创高景气赛道,不过市场同时存在一些基本面扎实、但交易冷清的低估板块 文|《财...
银发AI短剧市场:机遇与隐忧 主编温静导读:一边是银发群体稳定的付费能力与未被满足的情感需求,一边是AI技术带来的产能爆发与算法精...
开源证券获批碳排放权交易业务资... 近日,开源证券获中国证监会正式批复,取得碳排放权交易业务资质,具备合规开展碳排放权交易及各类绿色金融...
美团LongCat开源Vita... 观点网讯:6月25日,美团LongCat团队正式开源VitaBench2.0,推出面向长期动态智能体...
赔付“缩水”?惠民保高压之下“... 近年来,惠民保被寄予衔接商保与创新药、填补带病体保障缺口的厚望。但行至2026年年中,惠民保在多重博...
老地标推出新玩法,豫园、复兴公... 古色古香的豫园将变身“痛城”,联动年轻人喜爱的国创IP,呈现“步步皆奇遇”的夜经济景象;百年法式复兴...