新方法提升AI预训练效率和准确性
创始人
2025-12-15 09:46:21
0

来源:科技日报

加拿大滑铁卢大学研发出一种名为SubTrack++的全新训练方法,不仅可大幅缩短大语言模型的预训练时间,更能显著提升其准确性。这一突破有望降低构建人工智能(AI)工具的成本与环境负担,让更多人用上强大、便捷的AI技术。

大语言模型是基于深度神经网络、专注于理解与生成人类自然语言的AI系统。其核心能力源于海量文本数据的预训练,借此学习语法规律、语义逻辑及上下文关联,从而输出贴近人类表达习惯的内容。这类模型的“大”体现在两方面:一是训练数据规模巨大,二是模型参数量极为庞大。正因如此,对其进行预训练往往需要数月时间,并消耗大量算力、专用硬件及电力,高昂成本使一般企业与机构难以承担。

为破解这一难题,团队开发出SubTrack++方法,可将预训练耗时缩减一半。团队指出,大语言模型能耗极高,即便训练时间仅减少5%,也能带来显著效益。从长远看,此类技术进步将推动更多人自主构建专属的大语言模型。

团队解释说,大语言模型本质是由庞大数字矩阵构成的神经网络,通过数十亿次试错学习预测文本序列。每当预测出错,模型便微调其数学参数以提升准确率。这一过程如同让模型“阅读整座图书馆”,从中学习人类如何使用语言。SubTrack++通过聚焦对任务最关键的核心参数,简化校正流程,实现高效微调,从而加速整体预训练。

团队期望,通过节省预训练时间,未来不只大型企业,普通用户也能构建并定制属于自己的AI工具。安全学习个人偏好后,大语言模型可成为真正的智能数字助理,适应不同用户的风格、目标与需求,成为人类工作与创造中的得力伙伴。

团队将在墨西哥城举办的神经信息处理系统会议上正式发表相关论文。

相关内容

热门资讯

爱美客:公司暂未有AI辅助研发... 每经AI快讯,有投资者在投资者互动平台提问:爱美客在AI辅助研发方面有哪些具体布局? 爱美客(300...
Adobe AI视频工具Qui... Adobe推出全新Firefly AI视频剪辑工具,通过智能化自动组装功能革新视频创作流程 Adob...
AI 的钱,百度已经赚到了 2 月 26 日,百度发布 2025 年第四季度及全年财报,显示 2025 年总营收达 1291 亿...
云南文山:银发消费活力旺 旅居...   不同于传统居家过年模式,今年春节期间,旅居康养、体验民俗文化成为不少银发族的新春消费新选择。  ...
江南文化绽放欧洲舞台!苏州惊艳... 现代快报讯(记者 高达)从运河畔的新春灯会到慕尼黑的博览盛宴,苏州正以文化为媒,向世界书写“各美其美...
起底胜宏科技港股IPO:“AI... 胜宏科技二次递表港交所,借 AI 算力PCB登顶全球之势,拟募资强化越南等海外生产基地 在 202...
看见古村|湖北彭家寨:武陵山水...   新华社武汉2月26日电(记者张阳)在鄂西南武陵山区深处,有这么一个山水环抱的小村庄,村里一些寨子...
在中国年里“成为中国人” ——... 参考消息网2月26日报道(文/唐斯琦)当“China Travel”与春节深度融合,“成为中国人”在...
旅业新增采购需求:急需接送机/... 在旅游行业,企业的采购需求涉及方方面面,寻找合适的合作伙伴需要花费大量时间和精力。如您需要寻找差旅供...
深圳前海三大文旅地标春节客流总... 本文转自:人民网“向前向海欢乐巴”备受市民游客喜爱。受访单位供图人民网深圳2月26日电 (刘森君)2...