刚刚!腾讯混元开源HunyuanVideo 1.5 元宝上线生视频能力
创始人
2025-11-21 12:17:29
0

就在刚刚,腾讯混元大模型团队正式发布并开源HunyuanVideo 1.5,一款基于 Diffusion Transformer(DiT)架构、参数为8.3B的轻量级视频生成模型,支持生成5-10秒的高清视频。目前,腾讯元宝最新版已上线该模型能力。用户可通过两种方式即可体验:一是输入文字描述(Prompt),直接实现“文生视频”;二是上传图片配合Prompt,轻松将静态图片转化为动态视频。

在元宝中可以通过文字和图片生成视频

HunyuanVideo 1.5模型具备全面且强大的核心能力,支持中英文输入的文生视频与图生视频。其图生视频能力展现出图像与视频的高度一致性。模型还具备强指令理解与遵循能力,能够精准地实现多样化场景,包括运镜、流畅运动、写实人物和人物情绪表情等多种指令;同时支持写实、动画、积木等多种风格,并可在视频中生成中英文文字。在画质方面,模型可原生生成5–10秒时长的480p和720p高清视频,并可通过超分模型提升至1080p电影级画质。

HunyuanVideo 1.5定位为“开源小钢炮”,以极轻量的8.3B尺寸实现开源最佳的效果;显著降低了使用门槛,甚至可在14G显存的消费级显卡上流畅运行,真正让每一位开发者和创作者都能“玩起来”。

HunyuanVideo 1.5 GSB(Good Same Bad) 评测结果

HunyuanVideo1.5通过多层次的技术创新,实现了生成效果、性能与尺寸上的平衡。HunyuanVideo 1.5创新的SSTA稀疏注意力机制(全称Selective and Sliding Tile Attention, 选择性滑动分块注意力)在保证高质量生成的同时显著提升推理效率,配合多阶段渐进式训练策略,在运动连贯性、语义遵循等关键维度均达到商用水平。

此前,视频生成领域的开源SOTA旗舰模型至少有20B,需要超过50GB显卡方可部署。HunyuanVideo 1.5的出现大幅降低了硬件部署门槛,以极低的门槛就可以获得旗舰模型的体验,目前模型已上传至Hugging Face和Github社区,欢迎广大个人与企业开发者、创作者下载体验。

相关内容

热门资讯

​【花Young贵阳】这个春天... 清晨推窗风里还带着湿意樱花却比昨日更精神了每一朵都噙着雨珠颤巍巍地立在枝头像是刚出浴的少女羞怯地探着...
AI算力需求驱动光纤行业步入景... 来源:证券日报 “现在(光纤)一天一个价,涨得非常厉害。”2月26日,《证券日报》记者以投资者身份致...
离谱!从卖家秀到买家秀,都是A... “看到一套衣服,想去评论区看真实反馈,结果发现图片上的光影和人体结构很奇怪,仔细看是AI生成的。” ...
从豆包、千问等到天禧AI:公共... 2026年开年,智能体再次成为人工智能赛道最炙手可热的关键词。2月11日,国务院以“深化拓展‘人工智...
中俄互免签证让两国民间交流更深... 参考消息网2月28日报道 (文/黄河 张超群 陈凯姿 董小红)2025年,中俄互免签证政策全面落地。...
全国5A景区百强!湖南两家上榜... 近日迈点研究院公布了“2026年1月5A级景区品牌传播力100强榜单”湖南2家入选长沙岳麓山-橘子洲...
男子爬到何仙姑雕像头顶拍照,山... 2月27日,有网友在社交平台发布视频爆料一游客的不文明行为。画面显示,在山东省烟台市蓬莱区,一名男性...
江西黎川:油菜花开引客来 绘就... 原标题:江西黎川:油菜花开引客来 绘就春日好美景央视网消息 春回大地,繁花竞放。近日,走进江西省抚州...
小伙在景区玩88元“窝囊版蹦极... 2月27日,河南新乡,小伙在景区玩88元“窝囊版蹦极”,反手抓住跳台,对面游客笑疯了,网友:最后还是...
AI时代,期待更好的文科生 (本文仅代表作者观点,与驾仕派立场无关。) 关于机器人,有一个几乎无人不晓的三定律: 1、机器人不得...