作者:毛烁
大模型技术突破到产业落地,中国AI产业的底层逻辑,正在进入新一轮变革周期。
过去,AI基础设施更多承担的是资源支撑角色,为模型训练和应用运行提供算力、存储和网络,但随着AI训练、推理和Agent应用快速增长,AI产业开始越来越重视算力最终能够转化出多少Token,以及如何持
续提升Token的生产效率。
于是,Token逐渐成为衡量AI价值创造的重要单位,基础设施的角色也在发生变化。其正在演变为一套围绕Token生产效率运行的生产系统。这种变化的背后,本质上是中国AI产业对基础设施提出了新的要求:从资源供给走向价值生产,从能力支撑走向效率驱动。
率先感受到这一变化的,正是身处产业链核心位置的基础设施提供商。联想正是其中的先驱者!
过去几年,联想持续推进AI基础设施战略升级。从异构智算平台、AI算力基础设施,到词元工厂(Token Factory),其价值锚点已经不再局限于服务器产品本身,而是通过打通从算力、数据到模型和应用的完整链路,将分散的AI能力转化为可规模化复制的生产能力。而联想对于自身的定位,也从基础设施提供商,转变为AI算力基础设施与Token生产体系的构建者。
也正是在这样的背景下,联想问天近期完成品牌焕新,并提出新的发展目标。联想集团副总裁、中国基础设施业务群总经理陈振宽透露,到2027年,联想中国基础设施业务群将锚定1000亿元人民币目标,并向中国服务器市场第一发起冲击。
联想集团副总裁、中国基础设施业务群总经理陈振宽
目标之外,当AI产业的价值导向开始从消耗算力走向生产Token时,联想又是如何完成这场换新升级的?
01 研发范式迁徙,从“稳态”规划到“敏态”创新
联想给出的第一个答案,来自研发体系的重构。
今天回头看,AI带来的变革并不仅仅是算力需求的爆发,更重要的是打破了基础设施产业长期形成的研发节奏。过去适用于通用计算时代的方法论,越来越难以适应AI技术快速迭代的现实。
三年前,联想问天品牌刚刚发布时,服务器行业的运作逻辑依然呈现出显著的‘稳态’特征。
在当时,通用计算与超算(HPC)占据着算力市场的主导地位。在这样的产业环境下,产品规划的核心锚点是上游芯片厂商相对清晰的三到五年技术路线图。服务器厂商则围绕这些长期规划制定产品迭代节奏,并投入近18个月甚至更长时间完成庞大的交叉验证矩阵,以确保产品能够满足大规模、普适化部署的需求。
但是,这种模式建立在一个重要前提之上。联想中国基础设施业务群服务器事业部总经理周韬指出,彼时产业链各环节的发展节奏相对稳定且可预测。无论是处理器更新周期,还是企业客户的采购需求,整体都遵循着较长周期的演进规律。因此,研发工作的核心任务是保证产品稳定性、兼容性和规模化交付能力。
联想中国基础设施业务群服务器事业部总经理 周韬
但AI的出现改变了这一切。
大模型快速发展,尤其是GPU技术进入高频迭代周期,基础设施产业开始面对前所未有的变化速度。周韬表示,过去可以提前数年规划的技术路线,如今往往在数月时间内就会迎来新的变量。与此同时,模型架构、训练框架,以及推理场景也在持续演进,使得市场需求变得更加复杂且难以预测。
而对于基础设施厂商而言,挑战已经不仅来自底层芯片的快速迭代,更来自上层模型与应用需求的持续变化。过去动辄数年的研发周期,开始难以跟上AI技术演进的速度。
换句话说,过去强调“做对产品”,如今更重要的是“更快的做对产品”。
这意味着,传统以长期规划和全覆盖验证为核心的研发模式,已经难以满足AI时代的需求。
面对这种变化,联想选择主动调整研发范式。
在深入客户需求调研的过程中,联想发现了一个重要现象。周韬坦言,虽然AI产业整体变化迅速,但真正进入训练与推理场景后,客户对于基础设施配置的需求并非是无限发散的,而是逐渐向少数高频组合集中。例如,在GPU服务器部署中,客户实际采用的往往是三到四种主流配置方案,内存规格、网络配置,以及加速卡组合也呈现出明显的集中趋势。
这一发现改变了联想对于研发资源配置的思路。
往往,服务器厂商需要针对海量软硬件组合进行全面验证,以确保覆盖尽可能广泛的市场需求,而现在,更高效的方式则是聚焦最具代表性的主流场景,将研发资源集中投入到客户最关注的配置组合之中。
基于这一思路,联想开始精简传统的大规模交叉验证流程,并与产业链头部合作伙伴建立更紧密的协同机制。通过聚焦核心场景和主流配置,研发团队能够在更短时间内完成产品定义、原型开发和客户验证。
周韬透露,过去需要一年甚至更长时间才能完成验证并推向市场的产品,如今往往可以在几个月内完成样机开发,并直接进入客户真实业务环境进行测试和迭代。
研发逻辑也由此发生变化。从以往的“验证充分后再上市”到如今的“快速验证、快速迭代、快速交付”。
这种“敏态”创新所带来的直接结果,是创新效率的显著提升。周韬透露,目前联想已经能够同时推进10至15个前沿产品项目的探索与开发,相比传统研发模式,新技术从验证到落地的周期被大幅缩短,产品迭代速度也显著提升。
这种变化除了发生在研发体系内部,也进一步影响了联想的生态合作策略。联想中国基础设施业务群战略总监黄山表示,随着国内AI产业快速发展,越来越多GPU及相关技术创新企业涌现出来。面对不断扩大的技术生态,企业不可能对所有方向投入同等资源,因此如何选择合作伙伴,本身也成为基础设施厂商的重要能力。
联想中国基础设施业务群战略总监 黄山
而联想的选择是,聚焦关键方向,与最具技术潜力和产业价值的伙伴建立更深层次协同。
不难理解,相比广泛布局,联想更倾向于围绕客户实际需求构建联合创新能力,共同完成产品验证、方案优化以及场景落地,从而让新技术能够更快转化为可规模化部署的生产力。
从稳态到敏态,从长周期规划到快速迭代,从追求全面覆盖到聚焦核心场景,这场研发范式的转变也反映出联想对于AI时代基础设施创新逻辑的重新理解。
对于联想而言,研发体系的重构,是这场转型的起点。
02 价值体系升维,构建高能效“Token工厂”
研发体系完成敏捷化改造后,联想开始进一步思考,如何让这些不断迭代的技术,最终转化为更高效的价值产出。
黄山的答案是,把基础设施的优化目标从硬件能力延伸到生产效率本身。在他看来,当产业开始以Token衡量价值时,决定竞争力的不再是单一设备性能,而是整个系统的综合效率。这一判断,也被系统性地写进联想近期首发的产业专著《词元工厂:词元经济的财富生产范式》中,该专著由黄山等主创撰写、中国科学院院士领衔推荐,围绕“词元工厂”“智能产能”“有效算力”“安全可控”四大核心概念,解构了AI基础设施从算力支撑走向智能生产系统的底层逻辑
在这一导向指引下,联想内部也提出了极具挑战性的目标:通过软硬协同优化,持续降低Token生产成本,推动每百万Token的硬件成本降低到1元人民币以内。
目标背后,考验的是一整套系统工程能力。
为此,联想也发布了万全异构智算平台V5.0和超节点解决方案,并构建了覆盖计算、缓存、容错、供电、通信和散热六大环节的优化体系。
首先是计算效率。为了进一步释放算力性能,联想将优化深入到算子、计算框架,以及算子编译系统等底层软件栈。黄山透露,联想团队近期在芯模编译优化方向的研究成果获得IEEE论坛优秀论文奖,也从侧面反映出其在底层工程优化上的持续投入
仅有算力并不意味着高效率。对于大模型推理而言,缓存系统同样决定着整体吞吐能力。围绕KV Cache(键值缓存),联想重点优化缓存命中率和缓存量化技术,以提升推理效率。
而当训练和推理规模持续扩大,系统稳定性开始成为影响产出的另一项关键因素。为此,联想构建了相应的容错机制,以保障模型训练过程中的MFU(模型算力利用率),并确保96卡级推理池能够长期稳定运行。
除了计算系统本身,基础设施底层同样存在大量优化空间。随着单机柜功率不断攀升,供电效率的重要性日益凸显,而联想则引入了800V高压直流垂直供电技术,通过提升电压、降低电流的方式减少能量损耗和发热,为高密度计算提供更高效的电力支撑。
与此同时,由于GPU集群规模越大,通信效率的重要性也越突出。黄山透露,联想计划在未来一年进一步推进光互联技术应用,并在软件层面研发自主计算通信库,以实现不同GPU平台之间更高效的协同通信。
而在散热系统上,依托联想“海神”全冷板液冷技术,让高功耗AI设备能够获得更加稳定的散热保障,从而支撑更高密度部署需求。
六大环节的优化体系看似分布在不同层面,实则共同构成了一条完整的效率优化链条,也为联想的“Token工厂”打下了基础。
03 从资源调度到产业交付:让“Token工厂”的飞轮转起来
六大环节的优化,能解决通用训练与推理场景下的效率问题,那么把这套体系推向极限的,是今年以来快速规模化崛起的Agent应用。
与前两年以问答式交互为主的大模型应用相比,Agent承担的是真实任务的执行工作。其不仅需要理解用户意图,还要自主完成任务拆解、工具调用、多轮推理以及结果反馈。
这种变化带来的是计算链路的显著拉长。系统需要同时管理更多并发任务、更复杂的上下文,以及更长周期的资源占用。
换句话说,同样一套底层优化能力,在Agent场景下面临的是全新的压力:计算资源如何分配、任务如何调度、缓存如何复用,成为影响整体吞吐量和响应效率的核心要素。
针对这些新的运行压力,联想在优化体系之上,给出了三个更具针对性的解法。
在安全治理方面,针对企业私有化部署场景,联想与火山引擎等合作伙伴共同打造安全能力体系,将公有云环境积累的大规模安全经验引入企业侧部署环境,相关产品预计于7月正式推出。
对于并发管理问题,联想引入了开源测试工具PinchBench,对办公、编程等典型Agent场景进行模拟测试,通过持续优化系统调度策略,提高复杂任务环境下的并发处理能力。
在缓存资源管理方面,针对多Agent同时运行带来的KV Cache占用问题,联想在Harness层之上增加了独立监控与调度机制,实现了缓存资源的动态分配和释放,从而提升整体资源利用率。
而当底层能力逐渐成熟,联想的下一步“落子”,便是如何让不同类型的客户真正用起来。
对此,联想构建了三种差异化的交付模式。
第一类是面向地方政府和产业园区的城域级公共Token中心。通过建设区域性AI基础设施平台,为产业提供统一的算力服务能力。
第二类是面向大型企业的私有化“Token工厂”。针对数据安全、行业模型,以及业务定制化需求较高的客户,联想能够将算力系统与企业现有数据中心基础设施进行联动,实现更精细化的资源与能耗管理。
“对于算力服务而言,我们在底层提供的技术栈与核心能力是一致的,改变的只是为契合不同客户需求而设计的交付形式。”黄山如是说。
04 写在最后
在AI技术普惠的时代交汇点,联想的这次“换新升级”的深层含义,是对底层范式的一次重新定义。
从敏态研发的流程重构,到六大环节的系统工程优化,再到面向千行百业的多元交付,联想的每一步都在印证其对AI产业逻辑变迁的精准洞察。面对日益庞大的算力需求与复杂多变的Agent场景,联想依托生态协同与前沿创新能力,正在重塑行业价值标尺,推动算力基础设施从传统“资源支撑载体”向高效能的“Token生产系统”跃迁。
穿越AI的演进周期,以Token生产效率为核心的新纪元已经到来。而联想倾力打造的这座千亿级“Token工厂”,是对自身业务增长的重新锚定,更是在新一轮算力变革浪潮中,为中国AI产业的规模化落地,筑牢坚实底座!