刚刚!腾讯混元开源HunyuanVideo 1.5 元宝上线生视频能力
创始人
2025-11-21 12:17:29
0

就在刚刚,腾讯混元大模型团队正式发布并开源HunyuanVideo 1.5,一款基于 Diffusion Transformer(DiT)架构、参数为8.3B的轻量级视频生成模型,支持生成5-10秒的高清视频。目前,腾讯元宝最新版已上线该模型能力。用户可通过两种方式即可体验:一是输入文字描述(Prompt),直接实现“文生视频”;二是上传图片配合Prompt,轻松将静态图片转化为动态视频。

在元宝中可以通过文字和图片生成视频

HunyuanVideo 1.5模型具备全面且强大的核心能力,支持中英文输入的文生视频与图生视频。其图生视频能力展现出图像与视频的高度一致性。模型还具备强指令理解与遵循能力,能够精准地实现多样化场景,包括运镜、流畅运动、写实人物和人物情绪表情等多种指令;同时支持写实、动画、积木等多种风格,并可在视频中生成中英文文字。在画质方面,模型可原生生成5–10秒时长的480p和720p高清视频,并可通过超分模型提升至1080p电影级画质。

HunyuanVideo 1.5定位为“开源小钢炮”,以极轻量的8.3B尺寸实现开源最佳的效果;显著降低了使用门槛,甚至可在14G显存的消费级显卡上流畅运行,真正让每一位开发者和创作者都能“玩起来”。

HunyuanVideo 1.5 GSB(Good Same Bad) 评测结果

HunyuanVideo1.5通过多层次的技术创新,实现了生成效果、性能与尺寸上的平衡。HunyuanVideo 1.5创新的SSTA稀疏注意力机制(全称Selective and Sliding Tile Attention, 选择性滑动分块注意力)在保证高质量生成的同时显著提升推理效率,配合多阶段渐进式训练策略,在运动连贯性、语义遵循等关键维度均达到商用水平。

此前,视频生成领域的开源SOTA旗舰模型至少有20B,需要超过50GB显卡方可部署。HunyuanVideo 1.5的出现大幅降低了硬件部署门槛,以极低的门槛就可以获得旗舰模型的体验,目前模型已上传至Hugging Face和Github社区,欢迎广大个人与企业开发者、创作者下载体验。

相关内容

热门资讯

真人短剧加速出清,AI漫剧倍速... 作者|尖椒 “国庆之后,很多人张口闭口都是漫剧,讲短剧的人都比漫剧少了”。 毫无疑问,漫剧已经接棒短...
刚刚!腾讯混元开源Hunyua... 就在刚刚,腾讯混元大模型团队正式发布并开源HunyuanVideo 1.5,一款基于 Diffusi...
科技赋吉韵 德保吉星岩焕新沉浸... 本文转自:人民网-广西频道近日,历经焕新升级的德保县吉星岩景区圆满完成全部工程,正式步入试运营阶段。...
烽火通信旗下长江计算中标邮储银... 每经AI快讯,11月21日,据烽火通信消息,日前,中国邮政储蓄银行2025年AI服务器(鲲鹏)和服务...
AI应用方向表现活跃 欢瑞世纪... 11月21日,AI应用方向表现活跃,截至9时36分,欢瑞世纪涨停,易点天下涨超10%,福石控股、万兴...
中国AI云,开始“抢座次”了 文|新眸 桑明强 当全球科技产业的目光都聚焦于大模型一日千里的演进速度时,一个更为现实的问题浮出水...
北京发布“AI芯片四大明星企业... 在内蒙古呼和浩特的联通智算机房里,近百台AI训推一体服务器正在高速运转——这里年均气温低至4℃,天然...
冬游中原好风光 来和天鹅一起过... 冬日的三门峡,流淌着别样的诗意。一群群白天鹅如约而至,用翩跹的羽翼划过长空,为“天鹅之城”披上一层梦...
颜值高、有看头 九绵高速的服务... 封面新闻记者 赖芳杰 摄影报道本是匆匆停留的高速服务区,为何成了社交媒体上的网红打卡点?颜值高、有看...
交城南堡:“一片海”激活一座村... 南堡村红彤彤的柿子挂满枝头藏在南堡村里“山西最近的海”藏在南堡村里“山西最近的海”不用远行,山西人也...