废弃硬件变身AI神器:768GB英特尔傲腾内存成功运行万亿参数大模型!
创始人
2026-05-25 04:39:30
0

快科技5月24日消息,据报道,Reddit用户APFrisco近日通过一套极客方案,利用6根二手英特尔傲腾DCPMM持久内存模块,在单GPU工作站上成功运行了拥有1万亿参数的Kimi K2.5大模型,推理速度约为每秒4个Token。

该系统基于英特尔至强金牌6246处理器与泰安S5630GMRE-CGN主板构建。内存系统总容量为768GB,由6根32GB三星DDR4-2666 ECC内存条与6根128GB英特尔傲腾DCPMM持久内存模块组成。

图形算力由两张华硕GeForce RTX 3060 OC 12GB显卡承担,存储设备采用西部数据WD SN850X 2TB固态硬盘,电源为华擎Steel Legend SL-850G 850W全模组电源。

软件运行层面,该方案采用了基于llama.cpp的GPU与CPU混合推理方法。通过llama.cpp的override-tensor标志,系统将模型路由组件强制分流至总计24GB显存的GPU中处理,其余参数则由傲腾内存承担存储与读取任务,有效规避了单卡显存不足的瓶颈。

英特尔傲腾系列产品虽已停产,但其介于DRAM与固态硬盘之间的读写特性,使其成为替代昂贵内存方案的特殊选择。

业内分析认为,随着CXL计算快速连接标准的成熟,未来市场有望出现更具性价比的字节寻址内存解决方案,以支撑大型语言模型对内存容量的迫切需求。

相关内容

热门资讯

什么情况下,本轮AI大行情会结... 本轮AI驱动的A股大波段行情,什么条件下才会终结? 申万宏源策略团队在5月23日周报中,以历史复盘的...
直击保险业“十五五”六大核心议... 2026年是“十五五”规划开局之年,保险业在低利率、风险出清等的重压之下勉力前行数年,终行至新旧周期...
废弃硬件变身AI神器:768G... 快科技5月24日消息,据报道,Reddit用户APFrisco近日通过一套极客方案,利用6根二手英特...
美国紧急叫停AI监管令!不想输... 快科技5月24日消息,据报道,近日,特朗普一项扩大政府AI监管权限的行政命令,在签署仪式开始前几小时...
足不出“沪”赏繁花!来宝山这5... 这片被花香浸润的宝山乡野,藏着最动人的夏日浪漫。 不必远赴旷野,无需久候花期,一同探访宝山这五座宝藏...
聚焦青年社交“急难愁盼”,海淀... 5月24日,“海淀有缘·为AI而生”科技青年情感支持交友首场活动——“海淀未来关系实验室·青年黑客松...
原创 A... 作者:Evin 编辑:刘致呈 审核:徐徐 出品:互联网江湖 这两天,腾讯云前核心负责人吴洪声在朋友圈...
深圳举办“AI+文旅”对接会 ... 观点网讯:5月23日,深圳市文体旅游招商推介暨“AI+文旅”资源对接会举行,32家企业现场完成签约,...
行业专家怎么看“AI赋能媒体变... 5月22日 2026文化强国建设高峰论坛 “人工智能与媒体变革”分论坛 在广东深圳举行 与会嘉宾聚...
文博会上海军团亮出AI底牌,大... 界面新闻记者 | 张熹珑 “嗨!我是灵犀,欢迎与我一起沉浸式感受上海。” 第二十二届中国(深圳)国...