阶跃星辰发布新一代开源Agent基座模型Step 3.5 Flash。该模型面向实时Agent工作流场景,最高推理速度可达每秒350个token。据悉,Step 3.5 Flash采用稀疏MoE架构,每个token仅激活约110亿个参数(总计960亿参数)。包括华为昇腾、 沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商,已完成适配。
上一篇:文脉薪火照新春 贵州麻江:状元府里年味浓
下一篇:AI也会拍马屁?当算法学会“讨好”人类