作为搞视觉和产品的,这次专门测了个“动物城”的本子。说实话,体验有点翻车,完全没达到预期。这个产品本来是冲着效率去的,结果生成的质量根本没法用,整体下来不太行。说下我的一些看法
1.动效太假了,说是视频,其实就是“PPT轮播”。那个狐狸跑步简直就是在溜冰,完全没有逻辑与物理感。
2.一致性崩坏,狮子一会儿大一会儿小,背景也在乱跳。这种视觉上的不连贯让我很抓狂,感觉模型对于连续画面的把控力还是很弱。
3.视频图片内容变形,特别是树懒那个爪子的特写,结构完全是错的。细节经不起推敲,这种幻觉问题不解决,也就只能当个玩具。
4.成品可用性极低,本来想着用它快速出个Demo,采用不了,现在的状态感觉就是个半成品。
整体给出一个先给 bad,虽然文生视频赛道很难,但这种质量确实拿不出手,期待后续能有个大的版本更新吧。