微软公司近日发布了第二代定制人工智能处理器Maia 200,宣称这是迄今为止所有公有云基础设施提供商中最强大的芯片。
微软表示,在某些流行的AI基准测试中,Maia 200的计算性能是亚马逊云服务最先进Trainium处理器的三倍,在其他一些测试中也超越了谷歌最新的张量处理单元。
强大的硬件规格
Maia 200是2023年推出的Maia 100芯片的升级版。该芯片专为以更快速度和更高能效运行最强大的大语言模型而设计。它集成了超过1000亿个晶体管,在4位精度下能够提供超过10 petaflops的计算能力,在8位精度下约为5 petaflops,相比原始定制芯片有显著提升。
微软表示,该芯片主要针对AI推理工作负载进行优化。推理是运行已训练AI模型的过程,随着AI技术的成熟,这已成为AI运营成本中日益重要的组成部分。
实际部署与应用
据微软透露,Maia 200已经在该公司位于爱荷华州得梅因的数据中心投入使用,处理包括Copilot 365、OpenAI的GPT-5.2模型以及AI超级智能团队的各种内部项目。公司计划在未来几周内在凤凰城数据中心部署更多Maia 200芯片。
云服务商的芯片竞赛
Maia 200的推出加速了主要云服务提供商开发自主AI处理器的趋势,以此作为英伟达图形处理单元的替代方案。尽管英伟达的GPU仍处理着全球绝大部分AI工作负载,但其价格昂贵且供不应求。谷歌近十年前就通过TPU开启了这一趋势,亚马逊的Trainium芯片目前已发展到第三代,第四代也即将推出。
虽然微软入局较晚,首款Maia芯片直到2023年Ignite大会才亮相,但微软表示,Maia 200与AI模型和Copilot等应用的紧密集成为其在许多工作负载上提供了优势。最新一代更专注于推理而非训练,这帮助其实现了比原版Maia芯片每美元30%的性价比提升。
成本效益成关键因素
由于公有云提供商在AI项目上投入了大量资金,成本已成为重要的差异化因素。虽然模型训练通常只是一次性或定期支出,但推理成本是持续的,因此微软、谷歌和亚马逊都在努力降低相比英伟达GPU的价格。
此外,微软还向第三方开发者开放了合作机会,提供新的软件开发工具包,帮助他们为Maia 200优化AI模型。该工具包从今日起提供早期预览版本。
Q&A
Q1:Maia 200芯片相比前代产品有什么提升?
A:Maia 200是Maia 100的升级版,集成了超过1000亿个晶体管,在4位精度下提供超过10 petaflops的计算能力,在8位精度下约为5 petaflops。更专注于AI推理工作负载,实现了比原版芯片每美元30%的性价比提升。
Q2:微软Maia 200芯片目前在哪些项目中使用?
A:Maia 200已在微软爱荷华州得梅因数据中心投入使用,处理Copilot 365、OpenAI的GPT-5.2模型以及AI超级智能团队的各种内部项目。公司计划在未来几周内在凤凰城数据中心部署更多芯片。
Q3:为什么各大云服务商都要开发自己的AI芯片?
A:主要原因是英伟达GPU价格昂贵且供不应求,而AI推理成本是持续性支出。通过开发自主芯片,云服务商可以降低成本、提高性价比,同时实现与自家AI模型和应用的紧密集成优化。
下一篇:没有了