金磊 发自 凹非寺
量子位 | 公众号 QbitAI
免费的视频AI,现在也能拿来拍修仙爽剧了???
你没看错,我们这就来展示一下免费视频AI的效果。
一个修仙爽剧——《一觉醒来,整个宗门都不够我打的》。
如何?是不是爽剧味儿一下子就上来了?
重点是,这不是我们手动拆分镜、手动挑模型、再一段段拼出来的。
而它的背后,用的正是Agnes AI最新推出的视频创作平台——Pavo。
简单来说,Pavo是一款PC端AI图片、视频与短剧创作平台;更关键的,它是第一款不限时、真正免费可用的视频、短剧、图片创作平台。
而早在这个月初,Agnes AI就已经把全模态API免费开放给了开发者。这一次,它又进一步把创作流程本身也打包给了普通创作者。
那么接下来,老规矩,一波实测走起~
一句话拍短剧,Pavo先帮你把活拆了
能生成视频,这其实并非Pavo的重点,毕竟这事现在大家都已经司空见惯了。
真正有意思的是,Pavo把短剧创作这件事拆成了一条能跑通的工作流。
为了方便理解,接下来我们就手把手再做一个有趣的视频——一支修仙防脱洗发水广告。
Prompt是这样的:
一位威严修仙掌门站在云海山巅,白发飘飘,身后万剑齐飞。他准备念出霸气台词,突然发现自己头顶被风吹得有点稀疏,表情瞬间慌张。下一秒,他拿出一瓶古风包装的防脱洗发水,画风从严肃玄幻切到夸张广告。洗完后,头发像瀑布一样恢复,连飞剑都开始给他鼓掌。
Pavo的第一步,是先把一句话需求整理成制作需求卡片;它自动生成了标题、概梗、时长、画幅、拆分镜模式、视觉风格和补充说明:
在确认无误之后,Pavo继续往下拆。
包括角色设计、场景设计和核心道具设计;同样是确认过后,Pavo会对应地生成图片:
不过这一步Pavo生成的人物有些年迈,这时,我们就可以要求它做修改:
仙尊好歹要帅的,美男吧。
于是Pavo就对角色做了重新设计:
随后进入分镜。
Pavo给这支广告拆出5个镜头:
镜头1:云海山巅,掌门迎风而立,仙剑林立。
镜头2:大风吹起白发,露出头顶稀疏,掌门慌张。
镜头3:掌门拿出古风防脱洗发水,表情从慌乱变成自信。
镜头4:清水冲洗,头发重生,金色轮廓光打在发丝上。
镜头5:掌门自信甩发,飞剑为他鼓掌,完成离谱但完整的广告收束。
这时候问题也来了。
第一次生成的视频里,部分镜头有分镜序号和四宫格布局残留;有一段和前后镜头衔接不上;还有头发状态、台词细节不符合预期。
于是我们继续提出修改要求:
2、3的视频要重新生成,视频2有序号,而且和上一个视频衔接不上;他的头发应该先是好的假发,被大风吹跑了,才秃头。分镜3的视频完全和分镜不符,其他视频不要动。
第二轮,镜头2改成大风吹过,掌门假发被吹跑,露出发量危机;镜头3改成掌门拿出洗发水,对镜头展示。
但对于这个结果,我们还是不太满意,继续提出修改建议:
2还是不行,他不是全秃,是秃了头顶,并且人物要开头就在说话,说这天下……还没说完,意识到头皮一凉,连忙惊慌失措地捂住头皮,等、等等!本座的秀发!3的台词改成:”慌什么!本座有神物在手!草本古方,固发养根,洗!发!水!”,5也重生吧,别冒出多余的手臂。
最后,在全部生成结果确认无误之后,Pavo便把5个镜头合成了约53秒的竖屏广告片。
来看一下最终的效果:
但有一说一,作为一句话起步、平台自动拆分镜、自动出图、自动生视频、还能定向返工的短剧广告demo,它已经足够说明Pavo的核心价值:是在帮你组织一条创作流程。
这背后就是Pavo的短剧Harness,本质上是一套面向创作者的智能创作系统。
用户不用自己研究复杂流程,也不用先拆剧本、想镜头、挑模型。只要输入一句话,系统会先判断你到底想做哪类内容:搞笑发癫短剧、情绪剧情、反转故事,还是宣传片、广告片这种传播表达视频。
然后平台通过多Agent协作,把任务交给不同专业角色。
有的负责理解创意和用户意图,有的负责生成剧情结构,有的负责拆成分镜和镜头节奏,还有的负责结合不同模型能力,自动选择更合适的生成方式。
比如角色一致性要求高的镜头,可以优先走参考图或参考视频方案;更强调效率和运动衔接的镜头,则可以采用首尾帧等方式完成。
平台里还内置了一批面向短剧创作的Skills,用来做风格识别、结构优化、镜头调度、模型适配和结果调优。
说白了,Pavo在做的不是给你一个生成按钮。它更像把短剧创作里的导演、编剧、分镜师、制片助理和模型调度员,塞进同一个工作流里。
按照这个方式,我们又实测了一个有趣的案例——《PPT成精了》。
Prompt是这样的:
一个打工人深夜加班改PPT,已经改到第18版。凌晨两点,电脑屏幕里的PPT突然成精,开始自己吐槽老板需求太飘、字体太乱、逻辑太散。打工人一开始被吓到,后来和PPT一起联手,把一份混乱汇报改成老板看了沉默的“战略级方案”。
有点意思,着实是有点意思。
当然,Pavo未必能一键替代专业影视团队,但它起码能让一个自媒体博主、运营、广告策划,先把脑子里的东西快速变成一个能看的版本。
并且从效果上来看,完全是可以在抖音、视频号等短视频平台上hold住。
以及,再次强调一下重点,自研模型全免费!
免费API跑出了4.66万亿Token
看完这几个case,一个问题就自然地冒出来了:
这么高频地试短剧、调人物、改分镜、跑视频,如果每一步都按商业API计费,创作者很容易还没跑出成品,账单先上头了。
这也是Agnes AI这次最核心的背景。
自6月1日起,Agnes AI面向全球开发者和创作者无限期免费开放旗下核心全模态模型API,包括:
文本模型Agnes-2.0-Flash;
图片模型Agnes-Image-2.1-Flash;
视频模型Agnes-Video-2.0。
据统计,Agnes全模态模型单周调用量已经达到4.66万亿Token!
其中,文本模型调用量达2.80万亿,多模态模型(图片、视频等)调用量达1.86万亿。
我们从这组数字可以看到一旦视频、图片、Agent这类高频试错场景的成本被打下来,用户真的会开始疯狂试。
免费API的意义,就是把试错这件事变得可承受。
而Pavo则是更进一步。API解决的是底层调用成本,Pavo解决的是上层创作流程。
Pavo主要由Agent、图片生成、视频生成和剧情短片四个模块组成。用户可以在Pavo内部选择模型、调整参数,也可以让Agent和智能模型路由帮忙决定该怎么生成。
其中Pavo的几个机制很关键。
第一是素材快速引用。
你生成的人物图、场景图、道具图,可以直接被后续视频生成调用,不用反复下载、保存、再上传。
同一个角色要连续出现在多个镜头里,同一个商品要在广告里保持外观一致,如果每一步都跨平台搬素材,创作会被大量琐碎操作打断。
第二是智能模型路由。
Pavo可以根据任务类型、生成难度和画面要求,匹配相应的视频模型。
简单常规场景,可以优先调用兼顾效果和成本的模型;人物动作、复杂运镜、多镜头叙事等更难的场景,则可以调度更高性能的模型或更合适的生成方式。
用户不用先研究“哪个模型擅长什么”,平台替你做一轮判断。
第三就是Harness调度。
它负责把需求理解、素材引用、模型调用、图片生成、视频生成、后续修改、成片输出这些环节串起来。这也是为什么我们在洗发水广告里,可以针对2、3号镜头做局部返工,而不是整个项目推倒重来。
至于模型更新,Agnes-Video-2.5-preview本周内即将上线。
这次升级重点将包括生成速度提升、运镜表现优化、物理规律还原增强、画面多样性提升、多参考图生视频/生图,以及字幕乱码问题改善。
免费不是终点,好用才是关键
过去一年,AI视频一直在卷画质,卷时长,卷运镜,卷真实感。
这些当然重要。但真正落到创作者手里,另一个问题会越来越突出:
你有了视频模型之后,真的能稳定做出内容吗?
毕竟短剧不是一个镜头,广告也不是一张图。
真正的创作流程里,有主题、有角色、有场景、有节奏、有分镜、有产品露出,还有无数次“这里不对,再改一下”。
这也是Pavo这类平台的价值所在。
它把AI视频从单点生成往连续创作推了一步。一个灵感进来,系统先理解内容类型,再拆剧情、做人设、定场景、出分镜、选模型、生成图片和视频,最后继续根据反馈调整。
这套流程听起来复杂,但对用户来说,入口反而很简单。
输入一句话,然后不断补充自己的想法,Pavo会把背后那堆复杂流程全盘接住。
当然,客观说,它还不能完全替代专业影视制作。
工业级影视创作需要更稳定的角色一致性、更精细的镜头控制、更复杂的表演调度、更成熟的剪辑和声音体系。
现在的Pavo,更适合把一个灵感快速变成短剧雏形、社媒视频、广告创意样片,或者自媒体内容素材。
但这已经足够说明一个变化,即AI视频正在从模型秀肌肉,走向创作者真能用。
免费API让高频试错变得可承受,Pavo则让创作流程变得更好上手。
这两件事合在一起,才是这次Agnes AI更新真正有意思的地方。
当免费视频AI撞上短剧创作平台,普通人的创作门槛,确实又被往下压了一截。
Pavo地址:
https://app.pavo-ai.work/
下一篇:AI脸看腻了?“活人感”该回来了