刚刚!腾讯混元开源HunyuanVideo 1.5 元宝上线生视频能力
创始人
2025-11-21 12:17:29
0

就在刚刚,腾讯混元大模型团队正式发布并开源HunyuanVideo 1.5,一款基于 Diffusion Transformer(DiT)架构、参数为8.3B的轻量级视频生成模型,支持生成5-10秒的高清视频。目前,腾讯元宝最新版已上线该模型能力。用户可通过两种方式即可体验:一是输入文字描述(Prompt),直接实现“文生视频”;二是上传图片配合Prompt,轻松将静态图片转化为动态视频。

在元宝中可以通过文字和图片生成视频

HunyuanVideo 1.5模型具备全面且强大的核心能力,支持中英文输入的文生视频与图生视频。其图生视频能力展现出图像与视频的高度一致性。模型还具备强指令理解与遵循能力,能够精准地实现多样化场景,包括运镜、流畅运动、写实人物和人物情绪表情等多种指令;同时支持写实、动画、积木等多种风格,并可在视频中生成中英文文字。在画质方面,模型可原生生成5–10秒时长的480p和720p高清视频,并可通过超分模型提升至1080p电影级画质。

HunyuanVideo 1.5定位为“开源小钢炮”,以极轻量的8.3B尺寸实现开源最佳的效果;显著降低了使用门槛,甚至可在14G显存的消费级显卡上流畅运行,真正让每一位开发者和创作者都能“玩起来”。

HunyuanVideo 1.5 GSB(Good Same Bad) 评测结果

HunyuanVideo1.5通过多层次的技术创新,实现了生成效果、性能与尺寸上的平衡。HunyuanVideo 1.5创新的SSTA稀疏注意力机制(全称Selective and Sliding Tile Attention, 选择性滑动分块注意力)在保证高质量生成的同时显著提升推理效率,配合多阶段渐进式训练策略,在运动连贯性、语义遵循等关键维度均达到商用水平。

此前,视频生成领域的开源SOTA旗舰模型至少有20B,需要超过50GB显卡方可部署。HunyuanVideo 1.5的出现大幅降低了硬件部署门槛,以极低的门槛就可以获得旗舰模型的体验,目前模型已上传至Hugging Face和Github社区,欢迎广大个人与企业开发者、创作者下载体验。

相关内容

热门资讯

巴西对华免签利好南美长线游;三... 温江以体育为桥,为高质量发展凝聚更大合力5月10日记者获悉,由中共成都市温江区委组织部、区文化广电体...
澳门旅游发展协会来河北迁安开展... 本文转自:人民网-河北频道澳门旅游发展协会考察团参观迁安市塔寺峪景区。张泽慧摄5月6日至8日,澳门旅...
InXinjiang(117)...   俄罗斯博主阿利已经在中国生活了十余年,他几乎走遍了中国所有省份、近60座城市。此前,他受邀到新疆...
不用长途奔波!北京城区随处是治... 2026 年 5 月 9 日,立夏节气过后的北京,彻底褪去春日残留的微凉,温润的暖风常年盘旋在城市上...
原创 C... 电脑配置还不错的朋友,如果你的电脑里恰好还安装了Chrome,可能就得小心点了。 近日,计算机科学家...
美AI企业恼火:白宫内部大乱斗... 【文/观察者网 阮佳琪】 一天一小变,三天一大变。特朗普政府在人工智能(AI)监管上透明度不足、态...
AI,到底带来了哪些改变? 《人工智能通识课》林子雨 著 责编| 柒排版| 拾零 第 9599篇深度好文:5217字 | 14 ...
【“中国游记”第二季㉞】过境免... 在北京,有一条藏着近千年文脉的传奇中轴线。7.8公里纵贯古今——永定门的庄重、故宫的恢弘、天坛的灵秀...
杏山芍药艳,市民赏花来 杏山美... 5月8日,市民正在山东省淄博市淄川区杏山欣赏芍药。初夏时节,杏山芍药花开正艳,吸引着市民前来赏花登山...