新模型来了,百度最新发布!多家AI厂商迭代
创始人
2025-03-16 22:12:30
0

在发布文心一言两周年之际,百度又发布新款模型。

3月16日,百度正式发布文心大模型4.5及文心大模型X1。与此前不同的是,此次百度并未召开发布会,而是直接宣布新模型在文心一言官网上线,并免费向用户开放。

近期,国内AI大模型厂商纷纷宣布“迭代”。3月10日,字节跳动豆包大模型团队官宣开源一项针对MoE架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。3月6日,阿里巴巴发布并开源全新的推理模型通义千问QwQ-32B,通过强化学习,可在数学推理、代码生成等任务上实现精度提升。

百度发布两款新模型

3月16日,百度发布文心大模型4.5及文心大模型X1。据介绍,文心大模型4.5是百度首个原生多模态大模型。百度称,文心大模型4.5在多项测试中表现优于GPT4.5,API调用价格仅为GPT4.5的1%;文心大模型X1为深度思考模型,性能对标DeepSeek-R1,调用价格约为R1的一半。

具体来看,百度方面称,文心大模型4.5多项基准测试成绩优于GPT4.5、DeepSeek-V3等,并在平均分上以79.6分高于GPT4.5的79.14。而文心大模型4.5在多模态理解能力上提升,不仅有较强的图形推理、图表分析能力,还具备理解梗图、漫画、歌曲、电影等多模态内容的能力。

文心大模型X1定位为深度思考模型,在性能上对标DeepSeek-R1,具备“长思维链”,擅长中文知识问答、文学创作、逻辑推理等,而且增加了多模态能力和多工具调用,能理解和生成图片,还能调用工具生成代码、图表等内容。

作为能自主运用工具的大模型,文心大模型X1支持高级搜索、文档问答、图片理解、AI绘图、代码解释器、网页链接读取、TreeMind树图、百度学术检索、商业信息查询、加盟信息查询等多款工具。

据百度介绍,文心大模型4.5已上线百度智能云千帆大模型平台,企业用户和开发者登录即可调用API;文心大模型X1也即将在千帆上线。百度搜索、文小言APP等产品,将陆续接入文心大模型4.5和文心大模型X1。

随着大模型技术的快速迭代,训练和推理成本的降低,大模型开源已成大势所趋。

今年2月,百度曾宣布文心一言将于4月1日免费,并宣布推出的文心大模型4.5,将于6月30日正式开源。彼时百度还表示,将在今年下半年发布文心大模型5.0。

“从DeepSeek身上,我们学到了一件事,那就是开源最佳模型能大大促进人们使用或采纳这个模型。”2月18日晚,在百度2024年第四季度及全年财报电话会上,百度创始人李彦宏表示,开源的决策源自对技术领先地位的坚定信心,开源将进一步促进文心大模型的广泛应用,并在更多场景中扩大其影响力。他还强调,无论开源还是闭源,基础模型只有在大规模解决现实问题时,才具备真实价值。

AI厂商加速迭代

近期,AI大模型领域呈现技术迭代加速、多模态与深度思考能力突破、开源生态完善等趋势。国内外厂商在模型能力、应用场景等方面展开全方位竞争。

3月12日,谷歌DeepMind推出用于机器人技术的人工智能模型,这个机器人基座大模型名为 Gemini Robotics 和 Gemini Robotics-ER,旨在利用大语言模型的推理能力,帮助机器人适应复杂环境,从而完成现实世界中的复杂任务。

3月10日,字节跳动豆包大模型团队官宣开源一项针对MoE架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。据介绍,MoE是当前大模型的主流架构,但其在分布式训练中存在大量跨设备通信开销,制约了大模型训练效率和成本。针对这一难题,字节在内部研发COMET计算-通信重叠技术,可大幅压缩MoE专家通信空转时间。

3月6日,阿里巴巴宣布推出最新的推理模型通义千问QwQ-32B。这是一款拥有320亿参数的模型,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现提升,整体性能比肩DeepSeek-R1,在消费级显卡比如家用电脑上也能实现本地部署。随后,国家超算互联网平台正式上线通义千问QwQ-32B API服务,向用户提供免费100万tokens的试用额度。

日前,全球知名创投机构Andreessen Horowitz(a16z)发布了2025年全球100大生成式AI 应用排行榜,中国的AI技术实力在此次榜单中展现出强劲的竞争力。其中,DeepSeek在网页版应用中排名第二,仅次于OpenAI 的ChatGPT,其惊人的成长速度引起全球关注。

此外,在中国生成式AI中,字节跳动旗下的豆包也位列第十。中国其他知名的大型模型也成功进入榜单,包括月之暗面(第11名)、海螺视频(第12名)和快手可灵(第20名),它们的排名均超越了Sora、Midjourney、Runway 等全球知名应用。

平安证券研报认为,全球大模型的竞争仍然激烈,这种激烈竞争将持续拔升全球大模型的能力上限。同时,全球领先大模型厂商对大模型研发的持续投入,也将为AI算力需求的持续增长提供有力支撑。

中国银河证券研报分析认为,AI Agent(智能体)落地使得大模型集成度更高、算力资源需求更加旺盛,重心逐步从预训练转移到了特定应用场景的后训练,推理端算力规模有望提升。总体来说,推理算力有望推动应用的进一步增长,低成本算力时代带动应用端繁荣度提升,AI能力边际扩张依然需要依赖更强的模型和强大的算力支撑,有望开拓AI行业大模型共振发展新局面。

责编:杨喻程

排版:王璐璐

校对:李凌锋

相关内容

国晟科技:公司高度重视AI...
证券之星消息,国晟科技(603778)03月17日在投资者关系平台...
2025-03-17 17:13:46
阿里云启动“T项目”加速A...
观点网讯:3月17日,阿里云宣布启动“T项目”,旨在加速下一代AI...
2025-03-17 17:13:37
AI设计家、AI云展厅……...
深圳商报·读创客户端首席记者 王海荣 由土巴兔公司发起的“316有...
2025-03-17 17:13:22
阿里云启动“T项目” 加速...
钛媒体App 3月17日消息,据悉,阿里云已启动了“T项目”,主要...
2025-03-17 15:41:44
掌阅科技:正式上线掌阅精选...
每经AI快讯,近日,掌阅科技股份有限公司最新人工智能应用功能掌阅精...
2025-03-17 14:12:39
易鑫集团早盘涨超12% 正...
易鑫集团早盘上涨12.03%,现报1.49港元,成交额1.53亿港...
2025-03-17 12:40:07

热门资讯

王家大院现在的所有者还是王家的... 王家大院现在的所有者还是王家的后人吗?我说的是山西灵石的王家大院...现在不知道是被收为国,还是仍为...
写字好看的女生有什么优势 写字好看的女生有什么优势见字如见人,字好看 很加分的。学校有书法比赛时很吃香哦感觉没有打字快的女生有...
我家办白事,朋友给我发红包,我... 我家办白事,朋友给我发红包,我该怎么说感谢话我家办白事,朋友给我发红包,我该怎么说感谢话当家里有事情...
杨大勇的妻子是谁 杨大勇的妻子是谁杨大勇的妻子是一位名叫王小丽的女性。据悉,王小丽与杨大勇相识于大学时期,两人相恋多年...
小猿众包骗局 小猿众包骗局小猿众包是小猿旗下的可以在家做题赚钱的兼职,平时如果时间充裕的情况下可以做做小猿众包挣个...
顶级绝伦推理片100部介绍 顶级绝伦推理片100部介绍 《白夜追凶》;可以说是刑侦国剧天花板了,逻辑,叙事方式,主演演技,这些几...
女生说男生丑萌什么意思? 女生说男生丑萌什么意思?丑萌就是又丑又萌,意思是男生在她的审美里不是好看的那种,但是又很戳她萌点就是...
自从和女朋友确定关系后,女朋友... 自从和女朋友确定关系后,女朋友为什么每天晚上发视频要我给她讲故事哄她睡觉?每次给她讲一个小时她都不睡...
一个女生。让我去找她玩。是什么... 一个女生。让我去找她玩。是什么意思呢?求解。她是对你有好感的,不然也不会邀请你去找她玩。有可能把你当...
托举的意思是什么 托举的意思是什么一、“托举”是花样滑冰的技术名词。指两人在滑行中,以某一种连接方式,男伴将女伴托起至...