有点让人失望了。我主要想看看角色塑造与一致性,动态效果和角色演技,以及场景与氛围感。
我用了四段提示词,测试了文生图,图生图,图生视频,视频续写这四个功能。主要包括1️⃣生成角色,2️⃣把角色置于指定环境并指定动作,3️⃣让2️⃣生成的图动起来,4️⃣把3️⃣生成的视频续写
坦白说,结果差距有点大。本以为专门做动漫的总有跟别人不一样的地方吧,多少要有一些优势点才对,结果还不如豆包。而且豆包一次可以出四张图,萌动不充钱一次只能出1张,而且是只能是低画质的。
1. 角色塑造与一致性
优点: 在生成第一张静态人物图时,除了不是我要求的全身像,其他都符合我的描述,是一张不错的角色卡,但是我要求的风衣效果不是我喜欢的,大家可以看下我上传的图1,跟豆包的对比,我喜欢豆包的风衣效果。而且我要的是17岁少年侦探,萌动还算符合,相比之下豆包更有少年感。
缺点: 可惜,它的高光时刻也就到此为止了。在视频的特写镜头里,角色的脸型明显变了(看图3),从一个清秀少年变成成了青年,一致性保持得很糟糕。
相比之下豆包效果更好。它不仅生成了高质量的人设图,还额外给出了不同姿势和角度(比如全身、半身)的图片,并且每一张都保持了极高的人物一致性,眼镜部分有点瑕疵,有的好像是半框。这对想画漫画或做设定的用户来说,实用性高下立判。
2. 动态效果与角色表演
这是两者差距最大的地方,也是萌动“最不萌也不动”的地方。
我让人物往前行走,萌动本质上只是把一张不会动的图片进行了镜头推近,人物本身是在视频最后一两秒才开始走,总共也就5秒钟的视频。更糟糕的是,把我好好的少年侦探变成了往前平移的人形立牌。走路姿势极其奇怪,衣服肩膀的晃动几乎看不见,倒是伞上面的雨水一直滴下来效果还可以。续写的视频也只是镜头拉近,毫无表演可言,眼神空洞,表情木然。
豆包真的要好不少,生成的视频则完全是另一个次元。头部动态,行走是身体自然晃动,和衣服的动态以及雨伞的飘带晃动,细节丰富得多。这样就立刻摆脱了图片感。
最关键的是,视频结尾处,角色的手有一个抬起来拉拢衣领的动作。这虽然是个小动作,但好像瞬间AI对表演的理解程度就加深了,赋予了角色生命感和故事性。 且随着头部的转动,眼神也跟随变化。
3. 场景与氛围感
萌动的静态雨夜场景图,我个人审美还是不如豆包,光影和水面倒影虽然都有,但是过暗,且“新宿街头”的霓虹灯牌也太少了,地面灯牌倒影也有一些死板。而且在视频中,人物在移动,但地上的倒影却基本上没有什么大的形态变化,这让角色好像一张贴在背景上的贴纸。
豆包的场景光影更丰富,而且在视频里,随着人物的走动,镜头平移,背景也产生了动态变化包括街道灯牌,地上倒影,路上行人等(萌动也有行人,但是全都是黢黑的一个背影),让整个空间的立体感和沉浸感更强,角色是“在”场景里的,而不是“贴”在场景上。
总结
萌动在生图的角色一致性上保持还不错,但是对于背景环境渲染不足,动态逻辑更是让视频像是动态漫,不知道大家看过动态漫没有,就是像PPT一样的漫画,而不是动漫。角色的表演细节这些核心动画要素更是少。这样的话,我想不通不用免费豆包的理由,量大管饱,萌动最便宜的充值都要一个月近四百吧我记得[抠鼻]