钛媒体App 12月12日消息,蚂蚁技术研究院今日宣布推出LLaDA2.0系列离散扩散大语言模型(dLLM),并同步公开了背后的技术报告。LLaDA2.0包含MoE架构的16B (mini)和100B (flash)两个版本,将Diffusion模型的参数规模首次扩展到了100B量级。(广角观察)
上一篇:昆明拟新增8家国家3A级旅游景区,分别是→
下一篇:【澜湄之窗】走,去云南绿春赴一场茶香之旅!