1秒钟生成3D模型!腾讯混元甩出5款开源3D模型,自研架构加速效果超30倍
创始人
2025-03-19 18:44:27
0

智东西

作者 | 陈骏达

编辑 | 心缘

智东西3月19日报道,今天,持续2天的混元3D开源日活动收官,腾讯混元一次性开源了5款全新的3D生成模型。其中,运用了腾讯自研3D生成加速框架FlashVDM的3款模型,实现了秒级3D资产生成,较今年早些时候开源的Hunyuan3D-2版本提速30倍左右。

▲左侧的Hunyuan3D-2 Turbo正高速生成3D模型

除了生成速度的提升之外,本次腾讯混元开源的3D模型还在贴图细节、材质表达上有明显提升。基于物理渲染(PBR)功能背后的模型从测试版升级到正式版,能让3D模型在渲染过程中更加真实,符合物理规律。

▲腾讯混元3D模型开源页面

面向创作者,腾讯自研的3D AI创作引擎迎来升级。新增的多视图输入功能可提升创作过程中的可控性,模型3D智能减面功能则可以降低模型的渲染压力。这一引擎还可以作为插件,直接在3D编辑工具Blender中生成3D资产。

现在,这一创作引擎已经支持了更多主流3D格式,可直接3D打印,也可将3D生成结果作为视频和动图分享,满足不同类型用户的使用需求。

体验链接:https://3d.hunyuan.tencent.com/

一、半秒钟生成3D模型,计算量暴砍超95%

本次开源活动中最大的亮点便是实现秒级3D资产生成的3款Turbo加速版模型,包括Hunyuan3D-2 Turbo、Hunyuan3D-2mini Turbo及Hunyuan3D-2mv Turbo。

这3款模型均采用了腾讯自研的FlashVDM通用加速架构,主要适用于在端侧快速生成3D资产,Hunyuan3D-2mv Turbo进一步支持了多视图输入。FlashVDM这一架构不仅能用于混元3D模型,也兼容大部分其他3D生成模型。

采用FlashVDM加速架构的模型,能将显存占用降低到5GB以内,生成时间缩短到1秒以内,兼容MacOS、Windows等操作系统,英伟达4050、3050、2060、1070等显卡均可以快速运行,若设备没有配备显卡,也可以在搭载M1等CPU的设备上流畅运行,获得比较合理的运行速度。

这一加速究竟是如何实现的呢?混元团队分享,3D模型的生成就好比堆积木,VAE解码是将画面分为多个积木,而将积木组装起来的流程便是DiT采样,上述两个环节占据了生成过程中超过99%的计算负载。

目前,主流3D生成模型采用Vecset架构。以采用这一架构的Hunyuan3D-2为例,生成一个3D模型大约需要半分钟。经过FlashVDM加速后,Hunyuan3D-2的生成耗时最短可以达到1秒钟,而Hunyuan3D-2 mini模型生成耗时最短可达半秒钟。

在DiT环节,FlashVDM的渐进式流蒸馏技术将标准版模型几十个推理步骤浓缩至个位数。在VAE环节,层次化体素解码技术将体素查询量减少了95%,动态KV选取降低30%,在与高效网络设计的结合后,计算量还可以进一步降低。

加速并未对模型的生成效果带来明显影响。在专业创作者的盲测中,仅用5-8步实现模型生成的Turbo模型,与未经加速的原版模型相比,可比率达到90%左右。

混元团队也分享了他们开发FlashVDM的原因。一方面,艺术家对3D模型的生成质量和可控性有一定要求,但在创作过程中,艺术家也需要有即时的反馈,才能快速迭代设计。在复杂场景中,如果能将单个模型的速度从30秒-60秒降低到1秒,将会极大地节约创作时间。

二、随手拍可生成3D手办,支持3D打印主流格式

腾讯混元3D AI创作引擎在开源日中迎来一系列升级。Web端多视图功能背后的模型Hunyuan3D-2mv,轻量版模型Hunyuan3D-2mini相应开源,而完整版的Hunyuan3D-2已经于今年稍早时候开源。

首先是多视图功能,这一功能支持用户上传2-4张标准视角图片,从而生成高精度、高质量的3D模型。

多视图模型提升了用户对生成结果的可控性,针对游戏制作、3D UGC创作等场景,可以大幅降低3D设计师从多视图原画到三维模型的制作成本。

在直播活动的实测中,测试人员用手机摄像头拍摄了随意放置在纸杯上的腾讯企鹅公仔,并上传正反面照片,模型在1分钟之后便给出了这一场景的3D建模。

▲左图、右图为手机实拍,中间为3D模型

腾讯混元3D AI创作引擎还引入了3D智能减面能力。在建模过程中,AI模型可能会将一些画面刻画得过于细致,切分为成千上万个三角面,这会给后续3D资产的渲染带来很大压力。

3D智能减面可以自适应生成几百至数千面的三角面,进一步提升几何边缘平滑度,生成结果可在低面片的基础上最大化体现模型细节,让模型布线更加规整,以降低渲染难度,提升模型可用率及生产效率。

实测中,在生成桌子这类几何结构较为简单的模型上,智能减面极大地减少了模型的三角面数量。而在生成下方的的青龙3D模型时,智能减面会在细节丰富的部位保留更多面数,在细节不多的部位自动减少面数,实现了成本和效果的平衡。

此次升级还实现了PBR(基于物理渲染技术)的材质生成效果提升,通过物理特性模拟技术,赋予模型更真实的颜色与材质表达。

兼容性上,除通用OBJ、GLB、FBX外,腾讯混元3D AI创作引擎现在可输出STL、USDZ、GiF、MP4等主流格式,无缝连接3D打印工具,也可支持模型快速预览及移动端实时交互,满足不同业务场景对3D模型格式的使用要求。

结语:多款模型获创作者好评,未来将持续升级

据腾讯混元团队分享,他们未来还将进一步提升模型和加速框架的性能。FlashVDM目前仅支持对3D模型生成的加速,而未来将加入对纹理生成的支持,从模型到纹理的生成管线总耗时有望控制在10秒钟以内,AI编辑功能也在研发过程中。

在腾讯混元3D开源日的直播过程中,有不少网友对混元3D模型的表现和开源决策表达了赞赏。相信无论是动漫创作者、游戏开发者等创意人士,还是3D模型的开发者,都能本次开源的模型中受益。

相关内容

“杭州六小龙”之一的群核科...
3月19日,“杭州六小龙”之一群核科技亮相GTC2025全球大会,...
2025-03-19 21:14:40
“杭州六小龙”之一,官宣开...
3月19日,在GTC2025全球大会上,群核科技宣布开源其自主研发...
2025-03-19 19:44:31
腾讯财报大超预期!AI战略...
腾讯在2024年展现了强劲的财务表现和业务增长,未来将继续聚焦AI...
2025-03-19 19:14:02
1秒钟生成3D模型!腾讯混...
智东西 作者 | 陈骏达 编辑 | 心缘 智东西3月19日报道,今...
2025-03-19 18:44:27
广东出品!全球首个腹透大模...
可为医护患三方提供24小时在线腹透专业知识咨询服务 羊城晚报讯 记...
2025-03-19 10:14:00

热门资讯

王家大院现在的所有者还是王家的... 王家大院现在的所有者还是王家的后人吗?我说的是山西灵石的王家大院...现在不知道是被收为国,还是仍为...
写字好看的女生有什么优势 写字好看的女生有什么优势见字如见人,字好看 很加分的。学校有书法比赛时很吃香哦感觉没有打字快的女生有...
我家办白事,朋友给我发红包,我... 我家办白事,朋友给我发红包,我该怎么说感谢话我家办白事,朋友给我发红包,我该怎么说感谢话当家里有事情...
杨大勇的妻子是谁 杨大勇的妻子是谁杨大勇的妻子是一位名叫王小丽的女性。据悉,王小丽与杨大勇相识于大学时期,两人相恋多年...
小猿众包骗局 小猿众包骗局小猿众包是小猿旗下的可以在家做题赚钱的兼职,平时如果时间充裕的情况下可以做做小猿众包挣个...
顶级绝伦推理片100部介绍 顶级绝伦推理片100部介绍 《白夜追凶》;可以说是刑侦国剧天花板了,逻辑,叙事方式,主演演技,这些几...
女生说男生丑萌什么意思? 女生说男生丑萌什么意思?丑萌就是又丑又萌,意思是男生在她的审美里不是好看的那种,但是又很戳她萌点就是...
自从和女朋友确定关系后,女朋友... 自从和女朋友确定关系后,女朋友为什么每天晚上发视频要我给她讲故事哄她睡觉?每次给她讲一个小时她都不睡...
一个女生。让我去找她玩。是什么... 一个女生。让我去找她玩。是什么意思呢?求解。她是对你有好感的,不然也不会邀请你去找她玩。有可能把你当...
八仙过海 各显神通,猜三个数字 八仙过海 各显神通,猜三个数字8,3,4解意:八仙即数字8,过海(也有唐僧向西天取经过海中有三人保护...