郑纬民院士:AI产业焦点转向高质量Token产能
创始人
2026-03-30 14:39:40
0

“只有让智能生成像水电一样被稳定地调度与供给,才能真正迎来算力制造Token为王的普惠智能时代。”中国工程院院士、趋境科技首席科学顾问郑纬民在“全栈智能 全域推理:Token爆发元年的全场景大规模推理服务”专题研讨会上说道。

郑纬民在演讲中指出,随着智能体、AI Coding(编程)等应用的爆发式增长,Token消耗量呈百倍、千倍级跃升,2026年已成为名副其实的“Token爆发元年”。AI产业的核心关注焦点,正从“模型参数规模、模型可用性”全面转向“稳定、低成本、高质量交付的Token产能”。

“未来的智能基础设施应围绕‘Token即服务(TaaS,Token as a Service)’进行重构”。郑纬民说,传统模型服务的核心是保障模型可得性与接口完整性,而Token服务的核心是保障Token产能的可用性,更关注成本、吞吐、延迟与可靠性等生产性指标,是一个极端复杂的多维系统最优化问题,必须完成全链路的系统级创新。

对此,郑纬民提出了TaaS发展的三大核心技术底座:一是全系统异构协同,通过将不同计算任务合理分配至GPUCPU、内存和SSD,打破算力瓶颈;二是存算协同实现“以存换算”,通过前置KV Cache等技术,大幅降低重复计算量,提升推理效率;三是面向SLO的智能调度,精准地将用户业务需求“翻译”为底层资源决策。

当日,趋境ATaaS高效能AI Token生产服务平台在会上发布。针对当前大模型推理服务中普遍存在的硬件资源闲置、软件适配滞后、算力配置粗放、架构演进失衡四大核心难题,该平台将有效破解大额硬件投入难以转化为优质 Token 产能、资源浪费与成本空耗突出的行业困境,以高效能Token生产为核心目标,可支撑万级别AI推理需求,并达到日均万亿级别Token整体产能。

来源:北京日报客户端

记者:孙奇茹

相关内容

热门资讯

北京旅游休闲绿道春季赏花地图上... 来源:环球网文旅频道走绿道、赏繁花、醉春烟——北京旅游休闲绿道春季赏花地图上线了,一起沿着绿道踏春去...
河南新县:古村踏春正当时 河南... 来源:环球网春风送暖,万物复苏。3月28日,走进河南省信阳市新县周河乡西河古村落,一幅诗意盎然的春日...
春日国潮山东|AI 沉浸式赏花... “华夏有衣,翩若惊鸿”。春日里的山东,国潮心动值拉满,古色古香古韵悠长,美人美景美不胜收,一起来解锁...
郑纬民院士:AI产业焦点转向高... “只有让智能生成像水电一样被稳定地调度与供给,才能真正迎来算力制造Token为王的普惠智能时代。”中...
千问开启AI体验活动,邀用户共... 【CNMO科技消息】近期,千问密集上线AI打车、AI充话费等一系列“AI办事”新能力。为更好地理解人...
春日限定浪漫 枣庄山亭岩马湖畔... 齐鲁网·闪电新闻3月30日讯 这两天,枣庄市山亭区岩马湖畔四万亩桃花迎春盛放,粉艳的花团缀满枝头,暗...
静安花朝节收官,欢乐不落幕:本... 昨天,大宁公园湖心上空上演大型无人机编队光影表演,向游客献上了“2026静安花朝节”收官演出。静安花...
领益智造:2026年将加速AI... 领益智造30日发布《致股东信》,其中提到,2026年公司将加速AI终端、人形机器人、AI服务器、汽车...
企业微信CLI正式开源,让“龙... AI时代,让办公软件与智能助理更好协同成为新的课题。3月30日,企业微信 CLI 开源项目上架 Gi...