2025 年 11 月 13 日,中国上海讯 - 国内领先的芯片IP设计与服务提供商安谋科技(中国)有限公司(以下简称“安谋科技Arm China”)今日宣布,在上海举办“周易”X3 NPU IP新品发布会。作为安谋科技Arm China“All in AI”产品战略下诞生的首款重磅产品,以及“AI Arm CHINA”战略发展方向的关键实践,“周易”X3 NPU IP基于专为大模型而生的最新DSP+DSA架构,致力于打造端侧AI计算效率新标杆,在性能、功能与易用性等方面全面跃升,面向基础设施、智能汽车、移动终端、智能物联网四大领域,为加速卡、智能座舱、ADAS(高级驾驶辅助系统)、具身智能、AI PC、AI手机、智能网关、智能IPC(网络摄像机)等设备带来前所未有的AI计算体验。
安谋科技Arm China产品研发副总裁刘浩
安谋科技Arm China产品研发副总裁刘浩表示:“在‘All in AI’产品战略的指引下,我们将持续加大投入,以前瞻性视野整合顶尖研发资源,秉持开放合作理念,为生态伙伴提供业界领先的从硬件、软件到服务的端到端解决方案,全力赋能伙伴的产品创新和商业化落地。”
“周易”X3 NPU IP新品发布会现场
在半导体IP领域,“面向未来5年的产品方向进行前瞻布局”已成为行业共识——涵盖IP研发、芯片及终端产品研发量产。安谋科技Arm China深谙这一规律,前瞻性地在“周易”X3中采用兼顾CNN与Transformer的通用架构设计,支持全算力类型并增强浮点运算FLOPS,助力实现从定点到浮点计算的关键转变,并满足大模型计算需求,为未来5年Gen AI、Agentic AI与Physical AI的端侧落地奠定技术基石。
随着AI大模型技术的飞速发展,智能手机、AI PC和智能汽车等端侧设备正迎来AI能力的爆发性需求。从多模态语音助手到实时图像生成,从智能座舱交互到辅助驾驶决策,端侧设备需要承载越来越复杂的AI计算任务。然而,端侧AI部署面临算力受限、能效要求高、带宽瓶颈、开发门槛高等多重挑战——如何在有限的功耗和算力资源下实现大模型的高效运行,成为行业亟需突破的关键难题。
“周易”X3基于专为大模型而生的最新DSP+DSA架构,从计算效率、带宽、精度适配、任务处理四大维度实现升级,精准解决端侧AI大模型运行难题,打造端侧AI计算效率的新标杆。
其单Cluster最高支持4个Core,拥有8~80 FP8 TFLOPS算力且可灵活配置,单Core带宽高达256GB/s。相较于“周易”X2产品,“周易”X3的CNN模型性能提升30%~50%,多核算力线性度达到70%~80%。在同算力规格下,AIGC大模型能力较上一代产品实现10倍增长,这得益于16倍的FP16 TFLOPS、4倍的计算核心带宽、超过10倍的Softmax和LayerNorm性能提升共同驱动。
借助这些优化,端侧大模型推理将更高效:在Llama2 7B大模型实测中,“周易”X3 NPU IP在Prefill阶段算力利用率高达72%,并在安谋科技Arm China自研的解压硬件WDC的加持下,实现Decode阶段有效带宽利用率超100%,远超行业平均水平,满足大模型解码阶段的高吞吐需求。
“周易”X3 NPU IP新品亮点
此外,“周易”X3在架构层面实现了多项创新,集成以下关键特性:
安谋科技Arm China产品总监鲍敏祺
安谋科技Arm China产品总监鲍敏祺指出:“‘周易’X3遵循‘软硬协同、全周期服务与成就客户’的产品准则,提供从硬件、软件到售后服务的全链路支持,以前瞻性设计、专业团队交付与深度服务投入,全面助力客户产品成功与商业化落地。”
“周易”X3 NPU IP不仅提供高性能硬件,还配套完善易用的“周易”Compass AI软件平台,通过“软硬一体”的协同设计,让开发者从“好用”到“用好”,显著提升开发部署效率。
Compass AI软件平台通过覆盖开发全流程的工具链、极致的易用性优化与开放的生态布局,破解端侧AI开发“适配难、周期长、门槛高”的痛点。作为核心工具,平台中的NN Compiler(神经网络编译器)集成Parser(模型解析)、Optimizer(优化器)、GBuilder(生成器)及AIPULLM(大模型运行工具),可实现主流模型的高效转化、自动化优化与部署配置生成,并具备以下核心能力:
安谋科技Arm China积极构建开放生态,Compass AI软件平台中的Parser、Optimizer、Linux Driver、TVM及内部IR格式等核心组件已相继开源,并拥有丰富的调试工具,可满足开发者白盒部署需求,且支持更易用的DSL算子编程语言。在此基础上,平台赋予开发者更深度的定制能力:客户不仅可以使用平台中的Compiler、Debugger或DSL语言开发出自己的自定义算子,也可通过Parser、Optimizer等工具打造出属于自己的模型编译器,从而实现差异化设计与开发效率提升。
“周易”NPU Compass AI软件平台
不仅如此,安谋科技Arm China技术团队还围绕“周易”X3 NPU IP和Compass AI软件平台的软硬件协同进行精心设计和反复论证,目标是提升客户最终落地方案的效率和能效。例如,在“周易”X3 NPU IP的AIFF模块软硬件设计中,硬件端充分结合软件使用场景,通过增大总线带宽、增加DMA(直接内存访问)的outstanding(未处理的指令或数据请求)等方式提升数据搬运、数据并行效率,软件端则针对硬件特性设计专属使用模式,如对模型进行合理切分以充分发挥多核并行优势。
安谋科技Arm China NPU产品线负责人兼首席架构师舒浩博士
安谋科技Arm China NPU产品线负责人兼首席架构师舒浩博士认为:“‘周易’X3的产品优势,源于通用、灵活、高效且软硬协同的系统架构设计,这一设计使其兼具广泛的行业适用性与灵活的边端侧AI应用场景匹配能力。”
新一代“周易”X3 NPU IP将端侧智能的边界拓展至更广阔的应用场景,面向基础设施、智能汽车、移动终端、智能物联网四大领域,精准匹配当前爆发的端侧AI需求,可广泛应用于加速卡、智能座舱、ADAS、具身智能、AI PC、AI手机、智能网关、智能IPC等AI设备:
“周易”NPU IP系列家族现场demo展示区
此次发布会现场系统展示了“周易”NPU产品家族的技术演进与落地成果,生动诠释其如何将无形的算力转化为触手可及的智能体验。
从“周易”Z1的基础感知到“周易”X3的复杂认知,这一技术演进路径清晰地表明,端侧AI正在从单一的功能实现,迈向融合多种模型、适应动态场景的“全民普及”新阶段。“周易”X3 NPU IP的设计充分预判端侧AI的“场景深化”趋势:以极致算力表现破解“多模型融合”的算力需求,以全算力类型并增强浮点运算FLOPS适配“精度动态演变”的场景差异,借助软硬协同的生态打造端侧算力底座。
“周易”X3 NPU IP新品发布会现场
“周易”X3 NPU IP的发布,标志着安谋科技Arm China“All in AI”产品战略的正式开启。安谋科技Arm China以“AI Arm CHINA”为战略发展方向,积极响应“AI+”行动计划,持续深耕技术领域创新,同时携手伙伴共建开放生态,加快构建国内“AI+”产业升级的智能计算基石,为千行百业智能化转型提供更强IP“核芯”动力。