今晚19点|2GPU+2CPU微调万亿参数超大模型,带你上手开源项目KTransformers
创始人
2025-11-11 13:15:12
0

视点 发自 凹非寺
量子位|公众号 QbitAI

2GPU+2CPU就可以在本地微调自己的DeepSeek 671B / Kimi K2 1TB超大模型了。

这就是前两天量子位介绍的明星开源项目KTransformers,吸引了很多伙伴的关注。毕竟谁不想在本地跑个自己的猫娘呢(误)。

KTransformers如何实现更低成本的LoRA微调?与其他技术方案有什么不同?低成本高性能的微调方案对于大模型落地意味着什么?

于是,我们邀请到了KTransformers项目的两位重要成员——

  • 章明星,清华大学计算机系副教授,KTransformers项目主要指导老师
  • 李沛霖,趋境科技KTransformers项目核心参与者

带大家上手实践如何用KTransformers+LLaMA-Factory在本地微调超大模型,也一起聊聊项目背景与最新进展。

欢迎在「量子位」视频号预约&观看直播

直播嘉宾

章明星

清华大学计算机系副教授

章明星教授是KTransformers项目主要指导老师。其主要研究方向为计算机系统机构领域,相关成果在包括OSDI、SOSP、ASPLOS、HPCA、FSE、VLDB、ATC、EuroSys等国际顶级会议和期刊上发表论文二十余篇。曾获ACM SIGSOFT 杰出论文奖,IEEE TCSC、ACM SIGOPS等组织颁发的优秀博士毕业论文奖。获得国家自然科学基金青年科学基金及博士后基金一等项目资助。博士毕业后进入清华大学与深信服联合培养的博士后计划,负责创新业务孵化,担任深信服首席算法技术专家,后任职创新研究院院长。

李沛霖

趋境科技KTransformers项目核心参与者

李沛霖,目前就读于西北工业大学计算机学院,即将进入清华大学计算机系攻读博士学位。参与了趋境科技引擎开发,是KTransformers项目核心参与者,微调功能核心技术开发人员。曾获国家奖学金,院长奖学金(全院所有年级仅1人),多次获得国家级竞赛奖项。

核心话题

  • 认识KTransformers项目:如何实现更低成本的LoRA微调?
  • 手把手实操KTransformers
  • 聊聊KTransformers背后的技术与思考

参与直播

欢迎在「量子位」视频号预约&观看直播

关于「365行AI落地方案」

AI技术的落地应用不仅限于科技领域,它已经渗透到各行各业,成为推动产业升级的重要力量。因此,“365行AI落地方案”主题策划应运而生,我们寻找各行各业中成功应用AI技术的案例和方案,分享给更多的产业内人士。

相关内容

热门资讯

“跨年好去处”搜索热度飙升!年... 近年来,民众迎接新年的形式愈发多元,不论是游览名胜,还是畅玩冰雪,都颇具仪式感。今年元旦共有3天假期...
每周股票复盘:邦彦技术(688... 截至2025年12月26日收盘,邦彦技术(688132)报收于18.74元,较上周的18.45元上涨...
2025年热贡文化唐蕃古道行兰... 本文转自:人民网-青海频道黄河之约·金城相会2025年热贡文化唐蕃古道行兰州站农文旅商推介活动启幕黄...
《徐霞客游记》中两次提及的报恩... 从大理市区到鸡足山虽然有点远,但这座曾被徐霞客在他的游记中两次提及的报恩寺的吸引力也是显而易见的。不...
崇明的海风吹进浦江东岸,足不出... 这个周末,来自崇明的海风,吹进了浦江东岸,邀请都市人足不出“沪”,体验另一种“向往的生活”。12月2...
崇明文旅推介嘉年华亮相浦东前滩... 今天(12月27日),“域见上海 申爱崇明”崇明文旅推介嘉年华在浦东新区前滩公园巷举行。现场,近70...
抖音2025文旅报告揭晓!万岁... 12月24日抖音生活服务发布《2025文旅数据报告》郑州入选全国十大热门旅游城市洛阳、开封跻身全国十...
2025「Ai+消费品」日常生... “AI+消费品”是将生成式AI、计算机视觉等技术作为核心功能的产品,主要面向普通消费者。其发展历经“...
城市徒步新玩法!徐家汇“博物行... 徐家汇商圈 “如今看到的徐家汇空中连廊于2024年竣工,简洁雅致的造型和通透的结构,将连廊巧妙融入商...
人类基准测试大翻车:样本不足、... 我们经常在一些对比 AI 性能的测试中,看到宣称基础模型在自然语言理解、推理或编程任务等性能超人类的...