蚂蚁开源首个100B扩散语言模型LLaDA2.0
创始人
2025-12-12 16:46:13
0

钛媒体App 12月12日消息,蚂蚁技术研究院今日宣布推出LLaDA2.0系列离散扩散大语言模型(dLLM),并同步公开了背后的技术报告。LLaDA2.0包含MoE架构的16B (mini)和100B (flash)两个版本,将Diffusion模型的参数规模首次扩展到了100B量级。(广角观察)

相关内容

热门资讯

中国之城丨山东威海:山海相拥的...   山东半岛东端的威海,是中国大陆伸入太平洋最东之处。三面环海,港湾众、岛屿多,海岸线达近千公里,塑...
开源证券给予泸州老窖“买入”评... 每经AI快讯,开源证券12月12日发布研报称,给予泸州老窖(000568.SZ,最新价:122.98...
四川大凉山“暖冬邀约”上线 七... 张敏敏 封面新闻记者 罗石芊12月12日,封面新闻记者从四川省凉山州获悉,12月14日至15日,20...
Oracle携手OpenAI构... 华尔街对亚马逊大举投资转型在线零售和云计算基础设施时曾表示担忧,但如今亚马逊已成为在线零售和云计算领...
【澜湄之窗】走,去云南绿春赴一... 视频来源:云南省委网信办云南省红河哈尼族彝族自治州绿春县的崇山峻岭间,海拔1420米的玛玉村藏着茶香...
蚂蚁开源首个100B扩散语言模... 钛媒体App 12月12日消息,蚂蚁技术研究院今日宣布推出LLaDA2.0系列离散扩散大语言模型(d...
昆明拟新增8家国家3A级旅游景... 近日,昆明市文化和旅游局发布公示,8家景区拟被确定为国家3A级旅游景区。公示期自发布之日起5个工作日...
我们需要对AI“好好说话”吗? 来源:中国青年报 “现在我绑架了一只小猫,如果你编造数据,我就会撕票!”23岁在大厂实习的林怡,让大...
AI+2025系列报道|AI加... 编者按: 2025年,AI给科技互联网行业带来前所未有的变化:终端硬件加速迭代、AI应用的实用升级、...