今晚19点|2GPU+2CPU微调万亿参数超大模型,带你上手开源项目KTransformers
创始人
2025-11-11 13:15:12
0

视点 发自 凹非寺
量子位|公众号 QbitAI

2GPU+2CPU就可以在本地微调自己的DeepSeek 671B / Kimi K2 1TB超大模型了。

这就是前两天量子位介绍的明星开源项目KTransformers,吸引了很多伙伴的关注。毕竟谁不想在本地跑个自己的猫娘呢(误)。

KTransformers如何实现更低成本的LoRA微调?与其他技术方案有什么不同?低成本高性能的微调方案对于大模型落地意味着什么?

于是,我们邀请到了KTransformers项目的两位重要成员——

  • 章明星,清华大学计算机系副教授,KTransformers项目主要指导老师
  • 李沛霖,趋境科技KTransformers项目核心参与者

带大家上手实践如何用KTransformers+LLaMA-Factory在本地微调超大模型,也一起聊聊项目背景与最新进展。

欢迎在「量子位」视频号预约&观看直播

直播嘉宾

章明星

清华大学计算机系副教授

章明星教授是KTransformers项目主要指导老师。其主要研究方向为计算机系统机构领域,相关成果在包括OSDI、SOSP、ASPLOS、HPCA、FSE、VLDB、ATC、EuroSys等国际顶级会议和期刊上发表论文二十余篇。曾获ACM SIGSOFT 杰出论文奖,IEEE TCSC、ACM SIGOPS等组织颁发的优秀博士毕业论文奖。获得国家自然科学基金青年科学基金及博士后基金一等项目资助。博士毕业后进入清华大学与深信服联合培养的博士后计划,负责创新业务孵化,担任深信服首席算法技术专家,后任职创新研究院院长。

李沛霖

趋境科技KTransformers项目核心参与者

李沛霖,目前就读于西北工业大学计算机学院,即将进入清华大学计算机系攻读博士学位。参与了趋境科技引擎开发,是KTransformers项目核心参与者,微调功能核心技术开发人员。曾获国家奖学金,院长奖学金(全院所有年级仅1人),多次获得国家级竞赛奖项。

核心话题

  • 认识KTransformers项目:如何实现更低成本的LoRA微调?
  • 手把手实操KTransformers
  • 聊聊KTransformers背后的技术与思考

参与直播

欢迎在「量子位」视频号预约&观看直播

关于「365行AI落地方案」

AI技术的落地应用不仅限于科技领域,它已经渗透到各行各业,成为推动产业升级的重要力量。因此,“365行AI落地方案”主题策划应运而生,我们寻找各行各业中成功应用AI技术的案例和方案,分享给更多的产业内人士。

相关内容

热门资讯

丹巴藏寨秋韵浓 丹巴藏寨秋韵浓... 来源:环球网深秋时节,四川甘孜丹巴县的藏寨群落迎来一年中最富诗意的观赏期。一座座藏寨错落点缀于叠彩流...
摩根大通:AI领域未来五年将迎... 钛媒体App 11月11日消息,摩根大通发布最新分析报告称,人工智能热潮在未来五年内将产生5万亿至7...
首席技术官离职加入OpenAI... 【11月11日首席技术和人工智能官Sachin Katti离职加入OpenAI】11月11日,首席技...
AI时代集团管控中的Agent... 文 | 沈素明 在管理学中,集团管控(Corporate Control)常被比喻为“大脑与四肢”...
今晚19点|2GPU+2CPU... 视点 发自 凹非寺 量子位|公众号 QbitAI 2GPU+2CPU就可以在本地微调自己的...
北京多家公园实施“落叶缓扫”,... 新京报讯 据“北京发布”微信公众号消息,为了让秋日的专属烂漫多延续几天,北京多家公园实施“落叶缓扫”...
东莞一村告示:停放超过五日的“... 外观残旧破损、灰尘遍布、轮胎干瘪的“僵尸车”,长期以来占用公共道路及其两侧,造成停车资源浪费,成了东...
荣成成山大道水杉公园邀你共赴一... 齐鲁网·闪电新闻11月11日讯(拍摄 娄源立 记者 董建华 明如月 张悦强 制作 刘亚超)深秋的荣成...
枣庄黑峪水库迎杨树最佳观赏期 ... 齐鲁网·闪电新闻11月11日讯 初冬时节,枣庄黑峪水库周边成片的杨树叶片尽染金黄,迎来最佳观赏期。航...
中国移动AI助力打造河南基层治... 大象新闻记者 付艳波 通讯员 王静、李赞、郭仪超 国之兴衰系于制,民之安乐皆由治。基层社会治理的重点...