AMD ROCm 7.2.0版本发布:新增多款硬件支持,Instinct系列AI性能再升级
创始人
2026-01-26 11:49:58
0

AMD近日宣布,其开源软件堆栈ROCm正式推出7.2.0版本,为AI计算领域带来多项关键升级。此次更新不仅扩展了硬件兼容性,还通过底层优化显著提升了主流大模型的推理效率,进一步巩固了AMD在异构计算市场的技术优势。

硬件支持方面,ROCm 7.2.0新增对三款消费级显卡和锐龙AI处理器的官方认证。其中Radeon AI PRO R9600D专业卡、Radeon RX 9060 XT LP低功耗卡及Radeon RX 7700游戏卡均通过完整兼容性测试,而最新发布的锐龙AI 400系列处理器则成为首个支持ROCm的消费级CPU平台,标志着AMD加速计算生态向移动端延伸。

针对数据中心场景,新版本在Instinct系列加速器上实现突破性优化。通过内核级代码重构和内存带宽优化,MI355X运行meta Llama 3.1 405B模型时,推理吞吐量提升达40%,同时将端到端延迟压缩至原水平的65%。对于70B参数规模的Llama 3/2模型,MI355X与MI350X的联合优化使训练效率提升28%,特别在注意力机制计算环节展现出显著优势。

在国产AI生态适配方面,ROCm 7.2.0针对智谱GLM-4.6模型优化了GEMM算子实现,使矩阵运算效率提升35%;同时深度整合DeepSeek开源通信库,在MI300X集群上实现跨节点通信延迟降低22%。这些改进有效提升了国产大模型在AMD平台上的训练稳定性与扩展性。

系统级改进同样值得关注。新版本HIP运行时通过动态指令调度技术,使多线程任务执行效率提升18%;新增的多GPU节点电源管理功能,可根据负载自动调节加速器功耗,在保持性能的同时降低数据中心整体能耗。这些底层优化使ROCm在科学计算、金融建模等传统优势领域保持竞争力。

随着AI模型参数规模持续突破万亿级,硬件与软件的协同优化已成为决定计算效率的关键因素。AMD此次通过ROCm 7.2.0的全面升级,不仅强化了自身生态的技术壁垒,更为开发者提供了覆盖消费级到企业级的完整加速计算解决方案。

相关内容

热门资讯

ClickHouse收购Lan... ClickHouse收购开源大语言模型工程平台Langfuse,旨在为其专为在线分析处理和AI应用设...
使用简单脚本一键移除浏览器AI... 我不想在网页浏览器中使用AI功能,就是不想。我也不希望公司收集我的信息,或者推送赞助内容和产品集成。...
李彦宏砸5亿入局春节AI大战,... 瑞财经 吴文婷2026年春节红包战火再燃,但战场已从移动支付转向AI入口。 1月25日,百度发布文心...
“AI+”时代个体创业观察丨从... 编者按 我们正身处一场由AI驱动的生产力革命开端。旧规则溶解,新业态萌发:“手搓经济”点燃万千小众...
国家博物馆除夕闭馆,正月初一至... 国家博物馆今天(1月26日)发布2026年春节假期开放公告,公告称:·2月16日(除夕)闭馆。·2月...
2025未来全球劳动力报告 人工智能迅速发展的背景下,员工正逐步接受这一变革,但要真正适应并从中受益,需要明确的使命感和自我认知...
原创 特... 编辑:[熊猫] 在达沃斯论坛,特朗普的专机刚刚停到瑞士停机坪的那一刻,中方代表已同库克、戴蒙等美国商...
大秦铁路:目前公司正按股东会审... 每经AI快讯,有投资者在投资者互动平台提问:公司股票回购到什么地步了,怎么不见公示了? 大秦铁路(6...