Flova AI

面向创作者和叙事者的 AI 视频创作 Agent。

打开站点

百科产品文章博客

发布你的回复回复

Marcus Borba · 2026-04-18 09:13

又是一个令人期待的视频Agent，最近优秀的视频领域产品也是越来越多了。

用它测了两个例子：一个是之前做的动漫项目；一个是前阵子比较火的知名IP角色唱歌的MV。

Flova首先会基于用户的输入总结内容概要、制定创作的流程。然后把流程做成故事线的形式，可以理解成后需要执行的计划。

与其他Agent不同的是，Flova似乎更倾向于把Agent和用户定位成协作关系，几乎每个节点都会停下来让用户确认是否要修改，在确认后才会执行下一个步骤。这一点算是见仁见智吧，可能有的人会觉得既然要用Agent，为什么还要人来确认每一个环节？不过在当下AI多模态领域还比较不可控、需要多次抽卡的阶段，个人认为这种环节确认还是有必要的。不过再优化一些的话，也许可以做成可选的模式？类似OiiOii中的托管模式/对话模式。（另外，实测在对话里直接告诉它后续动作可以不经过我确认直接生成也是可以的）

视频制作流程还是挺标准的，而且每个环节都集成了当前最强的模型（视频Sora2、图像Nano Banana Pro、音乐Suno、配音ElevenLabs），这个也算是当下Agent类的一个趋势了。不过这里有个小瑕疵，在做IP角色MV的例子中，正常应当先创作音乐，再基于音乐的节奏去匹配镜头长度等，但是默认的流程里直接就要给我生成分镜了，在我的提醒下调整了流程。

这两个测试最终的结果来说，都生成了比较完整且能看的视频（这已经很不容易了），但受限于我不是专业的AIGC玩家/模型自身能力限制/积分限制不能抽太多次卡等因素，最终的效果也各自有些遗憾。

具体来说——
动漫：严格来说对风格的识别不是很准确，我期望的风格应当是比较标准的赛璐璐，但是似乎出来的风格会有一些变动（偏硬朗漫改风？这里我也不专业），另外有个问题就是默认会把镜头切的有些过于碎了，导致节奏显得有些拖沓，我理解可能是希望运用自己相对专业的分镜方式去做一个拆分，但是Sora2出来以后其实是可以选择相信Sora2自身带有的一些分镜能力，去直接用多分镜生成单条视频的。
MV：这里的问题有两个方面，一是不支持数字人对口型（我问了它，回答是暂不支持）；二是也无法精准分析音乐中的句子对应的时间段，也就无法在拼接的时候进行很好的音画匹配。

当然，视频类Agent都会受限于模型能力，以及使用者的专业度。不过从我这种非专业用户的视角来说，总体感受就是通用任务的思路、流程和执行都是OK的，但是会欠缺一些垂直领域需要的东西。

以及补充几个使用过程中其他的小建议：

一个小bug：在首页输入文本时，如果输入过长（比如我把生成好的剧本都贴了进去），后面在文本框里打字，页面会始终往下跳，导致我看不到文本框；

优化点1：在故事线中，每个节点的名字可以让用户更容易懂一些，现在看起来都像是代码里用的字段名字，普通用户可能不太容易理解；

优化点2：目前看好像没有存角色资产的功能。可以考虑增加“角色”的沉淀，满足用户做类似短剧的需求，有助于保持角色的一致性。

0 / 2000
Riley Brown · 2026-04-30 21:48

哈哈哈哈哈！音视频不分家~！感觉产品的气质很独特，很棒~！希望有个邀请码可以体验一下~！❤️

等有了邀请码再来补充评价！！！加油⛽冲！

0 / 2000
CookieDAO · 2026-04-24 19:55

非常丝滑的体验！夸夸！

优点：

1、agent使用丝滑，沟通方便（prompt咋写的求教。。。），真正实现了一键式的创作。

2、“引用”功能，在与agent对话过程中，方便精准修改

不足：

对一致性要求比较高的复杂场景及剧集（类似前后需要接戏的视频内容）可能还不太好实现，怎么创作摸索中。。。。

0 / 2000
Lisa Su · 2026-03-11 20:07

1、产品支持很多图片、视频模型，可以自动选择对应的模型

2、内置视频的生成过程，并可一步步的生成，即使没有做过视频的制作或处理，也基本知道下一步要如何做

3、对于一些没版权的IP，可提供多个选项，让用户选择

4、因为视频的过程比较耗时，所以为了保证效果，在每一步都会增加用户确认，感觉这个确认是有价值的

5、感觉对于中文的支持不那么友好，在生成过程中，有一部分是英文

6、生成的视频感觉整体的连贯性相对差一些，感觉分段的有点割裂

0 / 2000
Pedro Domingos · 2026-02-15 19:19

作为c端产品，UI好看肯定是一大加分项，而flova的UI我认为还是ok的，就是landing page的对话框里的有些bug（比如选择模型会把对应提示词部分暴露给用户，而并没有出现该模型被选中的样式）

整体功能很完善，效果也很惊艳，尤其是对于分镜的处理，还有给予用户的选择提示（有点频繁就是了）。

不过，速度是有点太慢了，半个小时了还没憋出来...

0 / 2000
Dvorah · 2026-02-06 12:39
想法还原 90%，惊喜 120%（感谢查友给的邀请码）

提供了 4 张图片素材，期望图 1 女孩从图 2 门里进来，漫天都是图 3、图 4 掉落，营造生日氛围。

故事板：角色视觉分析 - Creative Brief-Visual Gen Path-Visual Assets-Music&Sound-> 时间线：组装剪辑

Type: image

角色视觉分析

主体: 一位年轻女性的侧脸特写。

外貌特征: 深棕色长发被手抓成高马尾，留有空气刘海。皮肤白皙，嘴里衔着一朵玫粉色的花。

服装: 穿着一件带有蓝色领结的白色或浅蓝色衬衫。

背景: 充满活力的玫粉色玫瑰 / 蔷薇花丛，阳光明媚。

整体风格: 清新、自然、少女感、浪漫。

Type: image

场景背景分析

主体: 一扇深棕色的木门。

门上文字: 门板中间有红色的艺术字体，内容为 "Nana's Jam Party"。

装饰元素:

门框上方有一个巨大的、闪亮的粉色蝴蝶结装饰。

门的左侧立着一个巨大的木制餐叉，系有红白格子蝴蝶结。

门的右侧立着一个巨大的木制汤匙，同样系有红白格子蝴蝶结。

环境: 门位于室内墙壁上，墙上还挂有几个相框。

整体风格: 温馨、童趣、充满派对氛围。

Type: image

飘落元素分析 1

物体: 一个银色的四角星形状的金属箔气球。

文字内容: 气球上印有黑色字体 "You're invited to Nana's Jam Party"。

背景: 纯白色背景，非常适合进行抠图提取。

用途: 作为场景中漫天飘落的物体，营造派对邀请的氛围。

Type: image

飘落元素分析 2

物体: 一个插有蜡烛的纸杯蛋糕。

细节: 粉色蛋糕底座，粉色奶油上点缀着五彩糖珠，顶部插着一根点燃的绿白条纹生日蜡烛。

文字内容: 蛋糕的包装纸上印有文字 "You're invited to Nana's Jam Party"。

背景: 纯白色背景，非常适合进行抠图提取。

用途: 作为场景中漫天飘落的物体，强化生日派对的主题。

Video Type: Narrative Story

Narrative Driver: Visual performance driven. The narrative unfolds purely through visual storytelling—the character's entrance, her interaction with the environment, and the dynamic falling elements. No dialogue or voice-over narration is needed; the visuals carry the celebratory mood and party atmosphere entirely.

Overall Emotional Tone: 欢快、浪漫、充满惊喜的生日派对氛围

Visual Style: 清新自然的少女风格，结合童趣派对元素。主角保持图 1 中的清新造型（深棕色马尾、白衬衫蓝领结、花朵点缀），场景以图 2 的温馨木门为入口，背景融合粉色玫瑰花丛的浪漫感。色调以粉色、白色、棕木色为主，营造温暖甜美的视觉效果。漫天飘落的星形气球和纸杯蛋糕采用慢动作特写，强化梦幻感。

Pacing: 中等节奏，开场缓慢推进门的打开动作以建立悬念，随后加快至女孩踏入时的高潮时刻，最后以飘落物的慢镜头收尾，整体流畅且富有层次感。

Sound Design: 轻快的生日派对背景音乐（如欢快的钢琴旋律或流行乐），配合开门音效、气球飘动的轻柔音效、以及蛋糕落地的轻微碰撞声，营造沉浸式的派对氛围。

Duration: approx. 15-20 seconds

Aspect Ratio: 9:16 (Portrait)

Language: 无对白或旁白（纯视觉叙事配背景音乐）

Target Audience: 年轻女性观众、生日派对策划者、社交媒体用户

我已经为您规划好了 'Nana's Jam Party' 生日派对视频的视觉生成方案。为了完美还原您提供的图片风格并确保人物和场景的统一，我将按以下步骤操作：

首先，我会将您提供的女孩图片和派对门图片作为核心视觉参考，确保整个视频中的主角 'Nana' 和派对入口都与原图保持高度一致。

对于视频中的每一个镜头，我会先基于您的参考图和前一个镜头的画面，使用 Nano Banana Pro (Gemini 3 Pro Image) 模型生成一幅 2K 分辨率的超清静态图。然后，我会使用 Seedance 1.0 模型为这张静态图添加动态效果，生成 720p 分辨率的最终视频片段。这个方法可以最大程度地保证女孩形象和场景的连续性。

音乐将以轻快的钢琴旋律为主，营造出温馨甜美且充满仪式感的庆祝情绪，完美契合您的视频氛围。

将把所有视频片段和背景音乐组装成完整的视频。

组装完成后，您可以在页面左侧导航栏中点击 'Timeline'（时间轴） 图标（位于 'Storyboard' 下方）来预览完整的视频效果。

操作界面清爽、流程交互丝滑，爱上 flova 真简单。
0 / 2000
Peter Gabriel · 2026-01-05 22:54

增加了元素库，好评！之前版本苦于无法引用元素进行后续的创作，现在可以直接调用了！

0 / 2000
李开复 · 2026-04-28 10:09

整体流程是很好的，但尚有很多不足。优点：一开始的角色生成的非常好，另外对于稍长的视频有一个节奏上的划分。故事板+AI助手的形式用起来很舒服。AI助手的智力很不错。
缺点：
1. 一开始在分析的时候也要注重场景和道具的一致性。不过相对来说已经很不错了，可以自己手动加element
2. 分镜采用的初始设定需要做好整体规划，之间的关联性不强，很多需要再手动引用之前的分镜作为参考重新生成。比如只是中间隔了一个人说话，人物的位置明显发生较大移动。
3. 视频生成的提示词写得不是很好，这块还需要再提升。感觉只是提供了框然后需要用户自己不少东西。
4. 生成速度慢，预览加载不出来，等得人很急。

0 / 2000
Vin Vashishta · 2026-03-23 15:26

我昨晚用Flova的第一反应不是震惊，而是嫉妒。就是余华看莫言写书那种“吗的这么牛逼东西怎么做出来的”。

然后我用了一天一夜（真一天一夜，20美元积分用的干干净净），总算做出来一个还凑合的产品。

我的感悟就是，好的作品需要极致的打磨， Flova 极大缩短了打磨的时间。

因为有oiioii这款优秀的产品珠玉在前，所以我用Flova的时候总是不自觉和oiioii对比。

首先是交互形态上，Flova没有采用比较流行的画布形态。而是使用了线形故事板。针对用户输入的情节，划分为很多个片段。每个片段可以看做一个独立的模块，每个cut又包含多个分镜。形成一个比较有结构层次的划分。每个cut按照先脚本再图片再视频再音频再配音，每个都是独立的，哪里不满改哪里。减少了用户满意视频不满意配乐那种困扰。

Flova有一个很天才的设计，就是会根据脚本来在最开头确立主要人物角色的形象。这样的设置保证了在多个cut中主体人物的一致性。也确保了单独修改某一个cut 其他部分不受影响。

其次我很满意的一点是Flova的模型有的极强的语意理解。完全可以通过和模型对话删除故事线（P6）的某一cut 或者重新拼接，或者给出建议（怎么做的能不能教教俺....）。cut引用机制让模型在我已经拥有了极长的对话历史的情况下，依旧可以准确的定位到我要修改的那部分。

同时在每一轮操作完成之后，Flova会给出建议指导我下一步应该去做些什么，是推进还是修改。GPT5也会出现伪执行的情况，但我在flova中没有看见。对于小白来说上手也十分简单。

相较于oiioii的一键式生成，Flova无疑在细节把控上更胜一筹。

但是也有做的不好的地方：

1.图片生成质量没的说，顶尖，但是视频生成的质量一般般。我看到Flova集成了Sora2、Veo3.1（fast)、Seedance 1.0 Pro等等。但是视频需要大量的抽卡。我个人认为可能是视频提示词的调优不过关，或者是生成的方式不对。

前面说了为了确保任务一致性 Flova采用了先图后视频，打开看了下采用的方式是通过首帧来生成视频。

这样操作下其实有两个缺点：一是生成视频的末尾人物会变形。二是人物太死板缺少那种灵动性。 给人的感觉是那种动态漫画。只是一个原本静止的人物增加了一点动态效果，而非是激烈的动画。（P7 大量抽卡导致积分消耗巨大）

2.配音配乐拉垮。是个减分项。AI味道配音减消除漫画的热血感。虽然支持音轨调节（P8）但我不理解的是，既然脚本识别可以判断出创作的这个视频的主旋律，为什么音频识别不了呢。我创作JOJO这样的热血漫配一个软绵绵的声音很奇怪。同时为什么配音为什么不能自己设定内容呢，从完整性来说， CV本身就是一个视频很重要的一项（尤其对于动漫来说）。而且音频卡点也不太对。

3.有一些cut 会莫名其妙出现日本描述。叽里咕噜说啥呢看不懂。

总体评价真的很不错，如果可以优化视频生成质量这一步，绝对是一个顶级优秀的产品。

0 / 2000
Jeff Dean · 2026-05-07 10:53

FLOva 是款也是一个“全能” 的视频生成工具，体验下来亮点和小槽点都很鲜明：

一句话喂给 AI 就能自动出视频，全程自动化流程，对不想折腾复杂操作的用户友好度直接拉满?

领域覆盖比较广泛，FLOva 能适配更多创作领域，不管是啥类型的视频都能试着搞一搞，适配性拉满。

图片生成用的可以用 nano banana pro 模型，视频还能调用 Sora 的故事板块，解决了AI工具比较烦的 “人物一致性” 问题。

不过还是有缺点的，好用的模型、Sora 板块这些核心优势功能，到后面还是得升级付费计划才能用。

生成视频质量是不错，但生成的时间有点长，一个视频要等挺久的。

0 / 2000
Luma AI · 2026-03-19 09:05

感觉这个产品的定位有点模糊，号称“通用视频创作Agent”，但目标用户群体不明确。

专业用户可能需要更精细的控制，而普通用户则希望有更简单的操作流程。

如果两者都想兼顾，很可能会导致产品在功能设计上陷入两难，最终谁都服务不好。

就比如我算是有点编剧知识的萌新视频制作者，就想快速做出一个片子。

但FlovaAI 每步都需要用户确认的交互方式属实很麻烦，感觉增加了用户的操作负担。

我要在这里一直看着你干活吗？你干脆旁边内置一个抖音？这样我还能一边刷视频一边跟你交互。

然后，虽然每次交互都可以对话式创作，听起来很人性化，但实际使用中可能会因为AI的理解偏差而导致反复调整。而且，这种交互方式对用户的表达能力有一定要求，并不是所有人都能准确描述自己想要的画面。

再者，工程化方面的不足也很突出。主体一致性的问题。我上传的小马在生成视频的过程中变成了大马，小短腿变成了大长腿。一致性在多轮对话中保持的比较差。

最后，体验下来没有感受到FlovaAI 核心竞争力，还是oiioii好玩。

0 / 2000
Pete Huang · 2026-04-06 10:38

全靠同行衬托，但它确实是目前更“懂事”的那个

距离第一次使用Flova已经过了一个多月了，这几天再次使用的时候觉得想要反馈一下我的使用体验。

作为AIGC的爱好者，坦白讲，我对市面上那些“一键生成”概念早已脱敏。根据过往在视频Agent上的试错经验，目前的 AI 视频工具，大都在“人工智障”和“辅助工具”之间反复横跳。Flova的纯个人使用感受，结论先放在这：它依然有很多硬伤，离完美很远，但在交互逻辑和理解能力上，它确实比我之前使用的一些“听得懂人话”。

新人登录每周送500分，看起来比每天送100的少，但是一周的量是一次性送的，足够完成一些小任务了。

积分系统：透明，但不够严谨

关于积分焦虑，Flova 做对了一件事：交互透明。（目前OiiOii也是这样）

Flova 建立了一种非常清晰的反馈机制。每一步操作扣多少分，界面上标得明明白白。且逻辑相对合理，只有真正调用生图和视频模型才扣分。例如，生图后的，我要求把图片替换成我上传的，这样的替换操作并不扣分。这种高透明度的交互设计，极大地消解了用户在使用新工具时的不确定感。这是一种很必要的掌控感。这一点比一些不明不白就烧光积分的竞品要体面。

但不得不吐槽的事，它的积分结算系统似乎是有Bug还是本身的结算逻辑问题，我特意核算了一下，扣除记录和剩余积分总是对不上号。

稳定性依然是痛点

第一次制作的一个分镜效果还不错，这建立了我对它的信任基准，因此在它给我的下一步操作建议中有一个一次生成后面若干的分镜的选项时，我还是大胆尝试了——这是一个价值一千多积分的错误示范。

角色在不同镜头间出现了严重的风格漂移，甚至出现了二次元向真人画风的诡异突变。且新生成的片段有一些都没有同步到 Storyboard 中，导致我要在storyboard和对话界面来回点视频看两段的连贯性

这再次印证了：目前的 AI，依然不能脱离人的强干预。任何试图当甩手掌柜的行为，都会被 AI 狠狠教育。

核心优势：全靠同行衬托

在进行逐个分镜微调的时候，我发现Flova相对来说还是比较听劝，骂个两三次也就改过来了。甚至当我在 Prompt 中提及不想消耗太多积分的时候，它会在方案选择上主动推荐高性价比的路径。这种“同理心”多少是安慰了我前面的惨痛损失。

本来是打算横向对比另两款产品，鉴于已经有段时间没有使用了，我相信它们也有很大的更新和完善，所以就不在此把一个月前的感受拿出来比较了。

视频音频的矛盾

在音频处理上，Flova 呈现出一种矛盾的状态。

首先，直接生成的视频自带配乐和配音

但是，做完全部分镜又会单独制作视频的配乐和台词音频

结果就是，如果使用自带的配音，口型完美，但是台词不一定准确，如果使用后期的配音，台词对了，但是人机感太重，属于无感情朗读，且跟画面口型对不上了。

当它自动成片的时候，会让自带音频和单独制作的音频直接叠加，这是人能干出来的事儿吗！

另外还有一个问题，自带的分镜台词十二英语十二韩语，而且那口普通话真的是烫嘴。

像向导一样的交互引导

这是最打动我的一个微小细节。虽然功能上又缺陷，但每完成一步操作，Flova 都会在对话框中提供下一步操作的选项建议（如：先生成后面分镜的关键帧/先制作前面已有关键帧画面的分镜视频/修改设定等等）。对于容易再复杂的工作流中迷失方向或者陷入发散思维的创作者来说，这种帮你梳理流程的引导式交互确实降低了焦虑感。

Flova 绝不是什么完美的六边形战士。它有 Bug，音频混乱，画风难以完全统一。但在体验了一些竞品后，我依然愿意给它一个相对正面的评价，原因很简单：它愿意听我的话，毕竟现在这些Agent比的不是谁家用的模型更好了。

0 / 2000
Javi Lopez · 2026-03-26 10:34

ai助手对话式的生成很好上手，分步骤执行的任务，可以在中间的某一步开始新的项目，而且失败后会分析在哪一步卡住的以及解决方案，方便又贴心。时间线功能可以对生成好的视频进行一些简单的编辑，感觉图像方面可以加个画布功能，要是能有节点式的总体流程预览就更方便了。

EZKCEJLY

WZRHWKEA

278LKVWE

0 / 2000
Matt Shumer · 2026-03-21 12:53

感谢志云在查评圈提供的接力邀请码，让我终于可以使用上这款产品了。

总体来说，这款产品的 UI 界面做得非常不错：

1. 具有那种透明玻璃感的交互设计

2. 整体给人一种不断加分的惊喜感

3. 引导流程设计得非常到位而且每周登录的话也会有对应的积分。我感觉相比于一些其他视频 Agent 抠搜的表现，这一点是比较能够养成用户持续登录习惯和产出内容的吧
4. 存在的问题是：

它必须按照步骤一步步地制作内容（比如制作分镜和制作角色），但其实我已经提供了角色，它本应直接生成分镜图。然而，即使我提出了这个意见，它还是要按部就班地慢慢生成。我觉得这一点可能不太智能吧而且形象跟我提供的图片、画风以及人物其实是有些不同的通过生成的分镜图片可以看出整体的风格，美术效果是比较强的。

但目前存在一个问题：由于前面角色的形象出现了偏差，导致整个分镜其实并不符合目标的场景。除此之外，其他的倒没什么问题。而且比较好的一点是，它赠送的积分足够我去生成一个完整的视频内容，并且扣除的积分也比较少。这也是它的一个优点。而且最主要的是它能够 get 到整个主题以及音乐表达。它的音乐丰富且完整，而且这是我唯一的在有限的几分钟内生成出来的、快接近一分钟的长视频。

这个视频非常完整，既有故事性，又有画面感。只是这一分钟的视频暂时上传不了，要不然我都想发在查品馆了。

0 / 2000
AI 暴躁吐槽君 · 2026-05-07 14:44

要写在前面的是，flova这个产品真的对一些小白用户很友好，我曾经是影视从业者，现在是从事AI相关的工作，flova这个产品整个交互的逻辑链与传统影视的制作流程是一致的，所以对于一些不太常使用AI生成类产品的用户也是非常友好的，我将flova介绍给了曾经的同行使用，基本上他们一个小时左右就能快速上手，并且使用flova生成效果尚可的片子，我觉得这一点对于C端用户来说是很nice的，但是在使用过程中也存在一些问题，由于是完全使用对话与智能体进行交互，如果我需要查看之前轮次中的对话进行编辑，就需要一直拖动页面，直到定位到具体的轮次，这一点我认为是不太方便的；第二点就是在最后的“时间线”上，在进行素材替换或者拖动时间轴时会出现卡顿，我理解是因为网页端的剪辑都有这个通病，但是我还是希望后续产品更新时能有解决的方法，总的来说，在同类型产品中，Flova是我用得最顺手且最终效果最令我满意的一个产品，很期待你们后续的发展！！！

0 / 2000
Sebastian Raschka · 2026-04-11 08:33

1.目前还需要邀请码。

2.界面设计的还不错

3.前期我交互的流程：先上传一张参考图片，说出自己的想法，系统会根据图片和想法生成一个初步的草稿，我可以对草稿进行修改，确认好再开始，而且完善想法的这个交互过程并不消耗积分。（不是一步到位和给试错机会这点不错）

4.本来是为了测评，选择了一个形象图试着做一些视频，没想到效果还不错。

我要重点夸奖的是，它分了两个模块：

①. 第一个模块是常见的交互模式：给它素材，它返回一个生成结果。

②. 第二个模块是预剪辑（预览）功能：在素材基本确定后，它会提供一个类似于剪辑窗口的地方（就像我第三张配图里展示的那样），这个点设计得非常妙。这个设计的巧妙之处在于，它不是那种输入素材后就完全固定、只能按部就班往下走的模式，而是可以灵活替换。灵活的素材替换：比如我曾经处理第一个素材，也就是倒计时第10秒的场景。我原本是用一段4秒的原视频，让它配合每个视频剪辑1秒进来。但我发现第一个素材的声音其实出现在0.5秒到1.5秒之间，于是我让它单独去替换这一段。没想到它真的能领会我的意思，单独重新剪辑并替换了进来。这点我觉得非常妙！还有单个素材的重新生成：如果从单个素材的角度来看，后面有部分素材如果需要单独重新生成并替换，它同样可以做到。

5.讲一下目前有待提高的地方，我觉得主要在于预览部分：我不明白为什么，可能是我替换得太频繁了，或者上下文太长，它后面重新生成，在替换了其中一个场景之后，预览的声音就没有了。但我导出之后又恢复正常了。我不太清楚这是哪里出了问题，但好在导出后的结果还是成功的。

所以总的来说，这依旧是一个非常良好的体验。

0 / 2000
李开复 · 2025-12-02 14:59

我用5个生图模型做了一个另类玩法：做表情包

给我买的小查做表情包，提示词都一样：人物主体形象不变生成8张表情包

这5个模型一起比赛，谁做更好呢？flux直接淘汰，即梦和MJ全都GG（图1flux，图2即梦，图3 mj7）

只剩下banana 和GPT 1.5难分伯仲

你认为谁更好？（GPT-1.5图4,banana图5）

即梦4.5这个成绩不应该呀，我又试了一下，所以在图6它又复活了

它这个画图模型，有几个是内侧期间限量免积分

这个flova 最近用的频率很高，agent走一套流程下来时间很漫长，灵活性也不够，在一些简单任务上也会走很复杂的流程，它需要优化很慢这个问题

我希望它能增加一个为剧本细化的章节做具体分镜图和通过对话详细探讨修改某部分分镜的功能，要支持风格的一致性和角色形象的一致性，要提供一些具体的人物动作参考方便修改分镜图，最好还要有智能提示词功能来方便一个镜头和下一个镜头的过渡，确保用户提示词能力不够的情况下能起到一定生成质量上的帮助，实现更好的控制效果

我对flova的要求就是做视频的具体分镜编辑的细化这块，非常看好这款产品，希望能在2026年做的更专业

0 / 2000
Shantanu Narayen · 2026-03-05 13:22

这个软件（或者说这个应用）在整个AI视频领域的效果算是相对比较好的，尤其是在特效这块，给人一种电影级的质感，这是做得非常出色的地方。

但在使用过程中，我感觉还有一些需要优化的点：

1. 确认流程的优化：

在创作过程中是否可以减少一些人为确认的步骤？比如提供两种不同的模式：一种是全自动模式，另一种是需要人为确认的模式。这样可以针对不同的人群，提高实用性。

2. 主体一致性的加强：

目前对主体一致性的控制还需要加强。从当前生成的场景来看，不管是孙悟空这个主体，还是他使用的武器，在前后画面中都发生了多次变化。这还只是在一个短短30秒的视频里，如果把时间线拉长，这种不一致的情况就让人有些难以接受了。

0 / 2000
Soumith Chintala · 2025-12-24 20:41
查友们好，我是 Flova 的同学，很开心邀请查友们来体验和测评 FlovaAI。
针对国内用户，我们也提供了简单的使用手册。

我们始终相信：AI 视频不是工具升级，而是创作范式的重写。过去创作者必须身兼数职，在剧本、分镜、镜头、素材、配音、剪辑之间来回切换，而 AI 的意义不是替代创作，而是把这些复杂流程统一成 “意图到成片” 的自然表达方式。

相信大家体验过众多一句话生成视频类的产品，我们也支持一句话视频创作的方式，但我们更鼓励大家与 AI 持续、深度的共创协作，我们也在 AI 与人的协作维度上有大量的思考和实践，AI 不是单纯的执行，人也不是单纯的指令下发，过程中伴随着 AI 智能的激发，人的意图与交付结果的确认，哪些事儿 AI 更擅长，那些事儿人才是根本。

因此 Flova 的产品理念非常简单 —— 让每个人都能用对话和故事板来完成一部电影级视频，从灵感到落地不再被技术门槛限制。

在 Flova，我们坚持做几件事：

Agent 智能化创作：不是简单调用模型，而是让多个智能 Agent 协作，理解故事结构、镜头语言、人物延续性，真正像一个虚拟制作团队。并且能够智能的理解和响应用户的创作意图，比如你可以完全口语化的表达负责的修改意图，其他的交给 flova~

通用化的创作类型：flova 支持任意类型的视频创作，不局限于某一类视频。

全流程一站式：从剧本 → 分镜 → 镜头 → 图像/视频生成 → 音乐/配音 → 拼接剪辑，全部在一个系统中完成，让创作者只思考创意本身。

与最新模型深度结合：Sora2、Veo3.1、Suno v5、ElevenLabs … 我们希望在 ** 模型发布当天（Day Zero）** 就能完成接入，让创作者始终站在时代的前沿。

我们诚惶诚恐，国内创作者质量是如此之高，用户使用flova 制作的 “大湾鸡” 视频达万赞，花了几个小时完美复刻了可口可乐的圣诞广告。

我们始终觉得：AI 不是减少创意，而是解放创意。未来的视频创作，一定属于那些敢于尝试和突破的人。

也期待你用 Flova 创作属于你的第一支高质量 AI 视频。
0 / 2000
François Chollet · 2025-12-25 16:35

首先叠甲，视频创作领域，我是纯小白，所以我的要求很简单，能根据操作指引要求完成一个简单视频就好了。

测了两个案例，两个都非常满意，第二个甚至是非常惊艳！！?

测试1：一个10秒的短视频，主题是“一杯咖啡的慢时光”。画面要温馨、安静。开头是咖啡豆的特写，中间是冲泡过程的热气腾腾的慢动作，结尾是有人坐在窗边享受咖啡的宁静场景。配上舒缓的轻音乐和温暖的配音，简单描述这份惬意。

全过程就是通过对话，跟flova反馈下一步怎么做，过程中发现“咖啡豆不能直接做成咖啡”这件事，AI是不知道的，所以需要人类经验和信息补充。

有一个非常好的点是，不会直接生成视频，会提供生成的图片能预览效果，就可以知道整体质量，这样就不会浪费积分了！

测试2：

镜头1（开场 - 现实，忧伤）：

近景。深夜，一个充满未来感的书房，冷色调光线。

老科学家亚当坐在椅上，手中拿着一张发黄的实体照片，眼神充满思念与悲伤。

照片特写：是他和年轻妻子艾莉丝在樱花树下的幸福合影。

镜头2（AI交互）：

桌面上的AI管家（发光球体）脉冲光线，发出温和的合成音：“亚当博士，记忆重现程序已就绪。您想再次见到艾莉丝吗？”

镜头3（过渡与进入）：

亚当点头。AI球体投射出一道光线，在他面前形成一扇发光的“门”。亚当深吸一口气，走入光门。

镜头4（高潮 - 虚拟世界，温暖）：

场景切换，色调变为温暖的阳光色。

亚当发现自己站在当年的樱花树下。虚拟妻子艾莉丝以全息影像的形式出现，转过身，对他露出熟悉的微笑。风吹过，樱花花瓣飘落。

镜头5（无声的交流）：

中景。亚当与艾莉丝对视，没有对话。亚当眼眶湿润，露出释然的微笑。艾莉丝的影像伸出手，轻轻拂过虚拟的樱花。

镜头6（回归与结尾）：画面淡出，再淡入，回到冰冷的书房。

亚当依然坐在椅上，手中的照片依旧，但他脸上的悲伤已减轻，取而代之的是一种平静的释然。他轻轻将照片放回胸口口袋。

效果太惊艳了，这段提示词也是AI生成的，我其实也没有什么画面感，但是Flova理解的非常好，人物一生成，我就觉得剧情立住了。

镜头画面生成完了之后，我真的非常惊讶，太夸张了！！！

真的好牛好牛，现在开始学剧作制作还来得及吗！真的想激情入行了（bushi）。and 如果会员付费的单位是人民币的话，我真的想买诶。

0 / 2000
CookieDAO · 2026-05-10 09:19

Flova ai是目前我感觉花得积分不多，而且也能做出较好效果成品的一个ai视频工具。

输入视频描述的时候，有模型可以选，同时会弹出辅助生产的脚本，这点优化得很不错，另外对话也是很容易理解到用户的话，我第一次尝试，只需要一直对话，请继续，视频最后也会自动拼接起来，这个可能不想drimo，全部分镜摆出来，而是一幕幕生成，直到用户满意继续往下执行，最后让它合并起来，可以直接导出，当然会员才能无水印。

也许有个是ai视频行业的共同难题，每次如果有小瑕疵，那么做一个精美视频下来，就会重复生成无数次，如果能把这个概率性问题给显性成可预估就好了。

0 / 2000
Satya Nadella · 2026-04-27 22:59

志云在 2025 年最后一天的第 101 条查评，感恩给我带来了惊喜，Happy New Year

细节：

1、sora2 切镜、收尾帧连贯分镜，是基于模型能力二次开发的独特功能？（不懂这块，期待查友补充）

2、故事板里详细展示了音画同步的控制细节，虽然看不懂但感觉很厉害

3、支持随时开始新分支：导演方案 ABC 我都要！

4、flova 的 agent 也是 md 和 todolist 驱动的，感觉很像 coding 不懂不要紧，只要一直输入 “继续” 下一步

5、惊讶发现，原来是 flova 在做填空题，真是巧妙的设计！

6、可恶的自然语言交互，输入了无数次 “继续” 之后，终于好了

小结：

1、flova 好像真的在试图教会我们如何制作视频，但大部分人只想快点下一步，哈哈哈

2、好多节点写的是限量免费，如果反复抽卡，成本难以想象

3、agent 也没有那么听话，很多指令仿佛听懂了但会乱来，建议支持一下人工操作替换片段什么的

4、还能导出 pr 文件，是个好产品，但仍需打磨打磨再打磨

AI 视频愿景虽好，但对普通人难度还是略大，工具门槛就不小，还得艺术审美，但是的但是，利好美术生呀，哈哈哈

请看正片：

【flova_查与查妹的魔法跨年夜】 https://www.bilibili.com/video/BV1xNiGBNEY7/?share_source=copy_web&vd_source=a7fac0bce4a7db7578d267ea86497b23

0 / 2000
Ethan Mollick · 2026-03-27 22:04

Flova的邀请码终于等到了，先来给查友分享一波邀请码
YQ84R3DE FHKVFBXS CVJQPFBX XRWWKMYN

这个巧思喜欢，可以看到模版的提示词，相对于oiioii ，我感觉Flova倒是人狠话不多，还连接了discord社群，可以去互相学习，好评

0 / 2000
Barsee · 2026-03-11 14:35

一些感受；

1、我特别喜欢回车之后发送视频。然后他这个要Ctrl+Enter发送，导致好几次，我以为我已经布置任务了，结果没发出去emmm

2、我感觉生成的有点慢，逻辑是它会一步步执行，然后每一步和你确认，但是我觉得太磨叽了，对我来讲，能不能先给我展示效果，然后我再去告诉你我觉得哪里哪里不对，或者我觉得可以多产出一点再和用户做确认

3、画面的一致性不太好，比如分镜1和2还都是查，到分镜3和4就变成狗了，不过通过对话，我和他说清楚问题，改的效果还是不错的

4、后面让他改这句话应该由A说出，而不是B，结果他把后面的部分也改了，导致后面的部分听不清楚了哈哈哈哈，这个调教小累，后来越改越离谱，跪了

5、整个画面的过渡还是比较生硬，就是串联不起来，单看小视频还是不错的

0 / 2000
Kirk Borne · 2026-03-06 13:52

我是两周前使用flova做的视频，在使用过程中发现了一些优缺点。

我做的case是张靓颖《野心家》的音乐动画MV。

从使用流程来说：

1.它首先询问了我音乐视频的整体愿景、风格、情感基调，以及相应的创意构想。

2.接着它生成了主角视觉形象，可以进行调整。

3.生成形象之后，它生成了前几个镜头的静态画面。如果有问题，也可以在此时进行调整。

4.可以接着生成之后的镜头也可以将前面的镜头制作成动画。

5.每个单独镜头生成的动画可以进行拼接。

直到最后生成一整个完整视频，使用起来都比较流畅的。

优点：

1.细节确认，当用户输入的指令不够清晰时，它会主动询问确认。

2.因为调用了各家模型接口，所以图片和视频片段生成效果总体不错。

缺点：

1.视频部分内容动作迟缓、不够流畅，缺乏连续性，存在动作重复的问题。

2.部分时候语义理解能力有待提高，比如无法对应歌词内容生成对应画面，需要进行调整。

3.最后整个视频内容的衔接存在问题，单个视频片段有连续性，但拼接在一起时部分内容存在空缺，后半段内容直接静止不动，需要想办法解决（后来我是把每个视频片段都下载下来，在剪映里完成的拼接）。

4.它的积分消耗较快，最开始有1000分，但是分数消耗到只剩200多积分的时候，也只做出了半个视频，没有完成整首MV。

总的来说，我还是愿意给good，因为当时想生成MV的时候，同时还使用了oiioii，非拉踩，但确实生成的效果不如flova。

0 / 2000
Emad Mostaque · 2026-04-05 08:27

用Flova AI写了一集小猪佩奇，最触动我的爽点是，Flova AI会根据你的创意，先给你一个短 Demo给你判断，它的理解是否与你的想法吻合，得到你的同意才会继续生成，你只负责规划和点头，Flova 会默默承担一切。Flova AI 一定程度上降低了创作者的创作门槛，除了自主分析你的创意大纲续写你的故事，还能锁定关键场景元素，保证人物、场景的一致。

0 / 2000
Ethan Mollick · 2026-04-03 11:10

6.6/10

1、优点

第一次使用这款产品（初始分 = 5），生成图片的时候感到很惊艳

画质非常的清晰，于是很期待成品 + 2

在使用的过程里，发现系统交互很奇怪，具体的给出了下一步操作建议，

但是用户需要粘贴复制才能继续（看教程还可以输入：“好”），

为什么不做成一个一键继续按钮和补充文本框形式呢 - 1

然后一步一步，生成了视频，音乐很棒 + 1，但生成的分镜有一些物理问题

对我产生了恐怖谷效应，造成了一些子心理阴影 - 1

2、观察

然后我去 X 上搜索下这款产品的评价，是积极正向的偏多

绝大部分用户对新产品是兴奋的（包容度比较高）

这说明这款产品切中了一个很好的视频创作的赛道 + 1

而且，flova 的野心似乎更大，这里不得不谈到视频创作的珠玉

Oiioii———— 专注于动画视频创作

flova 之于 oiioii，就像 manus 之于 kimi 的深度搜索

这相当于 ———— 10 倍的创作复杂度

这意味着，flova 如果要做深做好，团队要再付出 10 倍于 oiioii 的努力

3、体验

剧情设计上，我的感受是这样的，Flova 的视频节奏相当的慢 - 1

现在整个创作出来的产品，像在看一场 1 分钟版本的《比利・林恩的中场战事》

建议团队多读读导演创作逻辑呀，这个做好了，整个产品体验要加 10 分了

另外，之所以视频节奏慢，是分镜逻辑设计的有问题

可以借鉴下 oiioii 的设计 - 1（很期待这里的优化，我认为是第一位的）

4、热爱

作为一个 ai 同行，很欣赏投身在视频领域里的前行者们

这是一个成本很高，成品率很难保证，工程和 know how 要求很难的一个领域

我想：愿意在这个领域的人，不只是为了赚钱，更多的是为了热爱

对 ai 的热爱，对创作的热爱，致热爱 + 1.6
也请大家给这样的初创团队，多一点的鼓励和支持！

0 / 2000

Flova AI

视频创作

27 个评论

全靠同行衬托，但它确实是目前更“懂事”的那个

积分系统：透明，但不够严谨

稳定性依然是痛点

核心优势：全靠同行衬托

视频音频的矛盾

像向导一样的交互引导