腾讯研究院AI速递 20260113
创始人
2026-01-13 06:17:09
0

生成式AI

一、谷歌推出并开源Agent购物协议,联手20+巨头,打通支付

1. 谷歌联合Shopify、沃尔玛等20+零售巨头推出通用商业协议(UCP),为AI智能体购物建立统一开放标准,覆盖商品发现到售后全流程;

2. 协议已在谷歌搜索AI模式和Gemini应用中实现"智能体结账"功能,支持Google Pay并即将接入PayPal,零售商保持交易主体身份;

3. 谷歌将UCP完全开源,兼容智能体支付协议、A2A协议和MCP等多种协议,降低生态参与门槛,让中小商家享受AI购物红利。

二、等了一年半!Midjourney 终于更新Niji 7,AI 绘画真的活了

1. Midjourney联合Spellbrush推出Niji v7动漫专属模型,修正v6偏写实倾向回归纯动漫感,眼神细节、动态肢体和材质质感全面提升;

3. 实测显示v7在光影细节、复杂姿势稳定性和纯动漫线条质感上全面超越v6,特别适合分镜生成和系列化创作。

三、一套「纯视觉考卷」BabyVision,把顶尖VLM打回幼儿园

2. 评测结果显示Gemini-3-Pro-Preview是唯一超过3岁儿童基线的模型但距6岁儿童仍差20个百分点,连线找垃圾桶等简单任务模型集体翻车;

3. 研究揭示VLM最大短板是无法将视觉信息完整语言化,这些"unspeakable"视觉题在压缩成token时细节消失,导致模型难以追线、数积木。

四、昆仑万维正式在天工超级智能体上推出 Skywork Video v1.0

1. 昆仑万维在天工超级智能体推出Skywork Video v1.0,以"项目制"整合创作流程,所有素材自动归集并一键添加至多轨道编辑器;

2. 提供文本生成、图片动效、首尾帧补全、多图风格参考生成及数字人视频生成五种启动方式,内置多轨道编辑器支持分割、替换等精细操作;

3. Skywork产品矩阵完成从文档、表格、演示文稿到视频生成的全模态覆盖,构建覆盖多场景、支持多模态的智能办公平台。

前沿科技

五、首个具身Agentic OS,给机器人配上真正的「操作系统」

1. 逐际动力发布全球首个具身Agentic OS——COSA系统,采用三层架构(小脑基础模型、高阶技能层、认知决策层)实现大小脑一体化融合;

2. COSA赋予机器人理解模糊指令、跨时间语义记忆和想到就能做到三大核心能力,机器人Oli实现"移动-操作-移动"一镜到底;

3. 与Figure AI的Helix端到端VLA模型不同,COSA从架构底层构建面向物理世界的操作系统,在移动操作融合能力上展现明显优势。

六、被Jim Fan点赞,千寻智能Spirit v1.5登顶,正式开源

1. 千寻智能开源VLA基础模型Spirit v1.5,在RoboChallenge的Table30榜单上位列第一超越Pi0.5,英伟达Jim Fan点赞;

2. Spirit v1.5核心突破在于采用"开放式、目标驱动"数据采集策略,摒弃"干净数据"转向内化物理常识,多样化数据使微调收敛速度提升40%;

3. 非结构化采集方式使人均有效采集时长增加200%,对算法专家依赖降低60%,开源权重、推理代码供社区复现探索。

报告观点

七、Anthropic联创:AI未必能够马上实现开发效率爆炸式增长

1. Anthropic联创Jack Clark透露内部调查矛盾数据:60%的Claude使用者自报生产力提升50%,但METR研究显示熟悉代码库开发者使用AI工具PR合并速度反降20%;

2. Clark指出代码生产存在"木桶原理"——写代码速度快10倍但审查只提升2倍,整体效率不会爆炸式增长,2026年1月地球上还不存在真正递归自我改进的AI;

3. 他强调如果Scaling Law撞墙将是最令人震惊的事,当前巨额基础设施投资表明大多数人押注相反结果,分布式预训练若突破将改变AI政治经济结构。

八、真香!刚骂完AI,Linux之父的首个Vibe Coding项目上线

1. Linux之父Linus Torvalds在GitHub发布首个Vibe Coding项目AudioNoise,使用谷歌Antigravity生成Python可视化工具,坦言"比自己写的效果好";

2. 该项目源自吉他效果器板设计,主要探索数字音频处理基础知识,包含IIR滤波器和延迟循环等零延迟单采样处理;

3. 仅在5天前1月7日Torvalds还在内核开发讨论中怒批AI生成垃圾代码"愚蠢至极",此次开源使用AI工具引发圈内"真香时刻"热议。

九、马斯克连续三个小时暴论,习以为常之余哪些新看点?

1. 马斯克预测2026年达到AGI、2030年AI超越全人类智能总和,AI性能每年10倍提升,xAI孟菲斯Colossus 2数据中心1月中旬达1吉瓦功率;

2. 他提出AI安全三关键词(真相、好奇、美),预测三年后Optimus手术水平超越顶级外科医生,五年内机器人从稀缺变充裕,2040年达100亿台;

相关内容

热门资讯

1月13日西部材料跌10.00... 证券之星消息,1月13日西部材料(002149)跌10.00%,收盘报46.45元,换手率14.03...
百川智能发布开源医疗模型Bai... IT之家 1 月 13 日消息,百川智能在今日举办的媒体沟通会上正式发布了其新一代开源医疗增强大语言...
从“秘境”到“解秘” 来源:中国西藏新闻网“垂直海拔跨越1000多米……一天能经历四季。”“跟着胡歌到了墨脱秘境,比视频还...
青岛世博园景区公告:部分项目冬... 1月13日,青岛世博园景区发布关于恐龙部落及游船码头冬季运营的公告。亲爱的游客朋友:为进一步优化游玩...
“网络爆款”竟然是AI写的?起... “10天受益3000+,纯软件生成,小白可做”“用大模型7分钟写了9篇短篇小说,都签约了”“下班后借...
岗什卡,不只是雪山 本文转自:人民网-青海频道高原冰雪季 五业兴青海岗什卡,不只是雪山人民网记者 甘海琼登山爱好者在岗什...
苹果牵手谷歌,Siri将迎来“... 1月13日,苹果与谷歌联合发布声明,宣布达成一项多年期的深度合作协议:下一代苹果基础模型(Apple...
图记|真武庙试开放 时隔90余... 近日,作为西城区第三批文物建筑活化利用项目核心之一的西海东沿真武庙试开放,并将于春节期间正式开放。这...
Phancy正式推出1300万... 近日,范式智能旗下消费电子品牌Phancy正式推出搭载1300万像素高清摄像头的AI智能眼镜,该产品...
野生冬樱花绽放美如画卷   近日,在云南省腾冲市曲石镇青岩子,高山峡谷间大片野生冬樱花进入一年一度的盛花期。成百上千株野生冬...