新方法提升AI预训练效率和准确性
创始人
2025-12-15 09:46:21
0

来源:科技日报

加拿大滑铁卢大学研发出一种名为SubTrack++的全新训练方法,不仅可大幅缩短大语言模型的预训练时间,更能显著提升其准确性。这一突破有望降低构建人工智能(AI)工具的成本与环境负担,让更多人用上强大、便捷的AI技术。

大语言模型是基于深度神经网络、专注于理解与生成人类自然语言的AI系统。其核心能力源于海量文本数据的预训练,借此学习语法规律、语义逻辑及上下文关联,从而输出贴近人类表达习惯的内容。这类模型的“大”体现在两方面:一是训练数据规模巨大,二是模型参数量极为庞大。正因如此,对其进行预训练往往需要数月时间,并消耗大量算力、专用硬件及电力,高昂成本使一般企业与机构难以承担。

为破解这一难题,团队开发出SubTrack++方法,可将预训练耗时缩减一半。团队指出,大语言模型能耗极高,即便训练时间仅减少5%,也能带来显著效益。从长远看,此类技术进步将推动更多人自主构建专属的大语言模型。

团队解释说,大语言模型本质是由庞大数字矩阵构成的神经网络,通过数十亿次试错学习预测文本序列。每当预测出错,模型便微调其数学参数以提升准确率。这一过程如同让模型“阅读整座图书馆”,从中学习人类如何使用语言。SubTrack++通过聚焦对任务最关键的核心参数,简化校正流程,实现高效微调,从而加速整体预训练。

团队期望,通过节省预训练时间,未来不只大型企业,普通用户也能构建并定制属于自己的AI工具。安全学习个人偏好后,大语言模型可成为真正的智能数字助理,适应不同用户的风格、目标与需求,成为人类工作与创造中的得力伙伴。

团队将在墨西哥城举办的神经信息处理系统会议上正式发表相关论文。

相关内容

热门资讯

外媒:聚焦乡村,中国兴起“反向... 来源:环球时报《旅行与旅游世界》杂志12月14日文章,原题:中国兴起“反向旅游”热潮,聚焦乡村目的地...
AI赋能业态焕新 中国信通院西... 央广网重庆12月16日消息(记者白刁尹)近日,2026中国信通院深度观察报告会西部分会场暨中国信通院...
哈尔滨企鹅雪地巡游创纪录,冬季... 当哈尔滨的百只企鹅迈着摇摆的步伐踏上雪地,这场看似简单的巡游不仅成为全网热议的焦点,更无意间揭开了冰...
技经观察丨太空AI中心能否破解... 太空AI中心是以AI算力太空部署为特征的新一代AI基础设施,旨在为AI发展突破能源、环境、空间瓶颈。...
原创 怎... 近日,亚马逊云科技re:Invent 2025全球大会在拉斯维加斯盛大揭幕。作为全球云计算和人工智能...
它是大理的第一批全国重点文保单... 如果你对大理的历史感兴趣,或者说对南诏古国有所耳闻,那么这个“太和城遗址”无疑是必打卡景点,没有之一...
深度智联“地产AI-Ready... 来源:环球网 【环球网科技报道 记者 林迪】当人工智能的发展重心从通用大模型转向能深入业务、自主执...
合庆郊野公园焕新!设施升级,野... 想逃离城市纷扰,却不想远途奔波?想深入森林秘境,解锁自然治愈力?合庆郊野公园历经数月升级改造,全新上...
蚂蚁集团旗下AI健康应用AQ升... 钛媒体App 12月15日消息,蚂蚁集团宣布旗下AI健康应用AQ品牌升级为“蚂蚁阿福”,并发布App...
元旦迎新|40余家博物馆首次举... 12月15日,北京市人民政府新闻办公室举行“钟鼓齐鸣 京彩启程——2026年北京元旦跨年文商旅体展融...