临近年末,AI领域的热度只增不减。尤其在AI视频生成领域,各大厂商频繁更新,火药味十足,真的是卷的飞起啊。谷歌刚发布完Veo 2和 Imagen 3, 快手 可灵1.6 的发布无疑再次定义了这一领域的天花板。作为一款针对文生视频和图生视频(Image-to-Video)功能进行全面升级的版本,可灵1.6的表现是否能满足日益苛刻的用户需求?我们通过多个高难度的测试案例,从物理真实感、人物表现力和语义理解能力三个维度对其进行了深度测评,以下是详细结果。
文生视频测评:猫与镜中的狮子
Prompt:一只猫在镜子前咆哮,但却看到自己是正在咆哮的狮子。
这段提示词我分别测试了veo2,pixverse,runway,luma,kling,sora,pika,hailuo,vidu.废话不多说,看效果:
veo2(左) pixverse(右)
runway(左) luma(右)
sora(左) kling(右)
pika(左) hailuo(右)
vidu
测评表现:
从这个提示词整体上看 veo2和hailuo在效果上稍微会更好一些。这一句提示词看似非常简单,实际上还是很复杂的。镜中狮子的表情与姿态与现实猫的动作要完全同步,镜面反射表现要极为真实。而且咆哮时猫的毛发细节和肌肉紧张感表现要自然,狮子的威严也要完美呈现。可灵在这块说明还是有进步的空间。
图生视频测评:从三大维度解读可灵1.6
看完文生视频,重点我们看下可灵1.6的图生视频
1. 物理真实感的跨越式提升:从真实交互到细节反馈
测试案例 1:圣诞老人递礼物
Prompt:一位面带温柔微笑的女孩穿着圣诞老人服装,害羞地递出一个礼物。
- 测评表现:
- 面部表情精准表现了“温柔微笑”和“害羞”的情绪,手部动作流畅自然,递礼物的过程无卡顿。
- 服装的材质表现优异,毛边细节和衣料的褶皱都贴合动作变化。
测试案例 2:冰狮骑行
Prompt:一位女孩打扮成圣诞老人,在冬天骑着冰狮前行。
- 测评表现:
- 冰狮的毛发细腻,骑行中的动态反馈精准,脚踩雪地时的物理交互表现到位。
- 雪地的光影效果自然,冰狮呼吸时的雾气表现尤为惊艳。
测试案例 3:少林寺和尚骑龙
Prompt:一个少林寺和尚在草地上起身去骑一只趴在地上的龙头马身神兽。
- 测评表现:
- 起身和靠近神兽的动作连贯流畅,草地在脚步移动时有明显的下压效果。
- 神兽的鳞片细节和光泽感表现极佳,整体画面仿佛取自奇幻电影。
2. 人物动作和表演:AI“演员”的表演越来越细腻
测试案例 4:女孩跳舞
Prompt:一个女孩穿着花裙跳舞。
- 测评表现:
- 动作表现灵活自然,花裙的飘动与肢体动作的同步细腻。
- 跳舞过程中的表情变化贴合节奏,呈现了很高的表演力。
- 进步空间:
- 人物的手在碰到脸部时,可以看到脸“坏”了,不过这个应该是通病,挺难的(狗头)
3. 语义理解与复杂场景构建:精准响应复杂指令
测试案例 7:废墟中的赛博女孩
Prompt:身穿部分机甲的女孩,眼戴红色护目镜,打开一辆废弃的赛博车车门,坐上去后关上了车门。
- 测评表现:
- 赛博车的设计感极强,车门的开启与关闭动作平稳自然,机甲细节光泽感表现优异。
- 女孩的动作流畅,护目镜反光效果非常真实。
测试案例 8:跑酷女孩
Prompt:一个跑酷街舞女孩在街上跑酷摔倒,马路上溅起层层水花。
- 测评表现:
- 跑酷动作流畅,摔倒时的水花效果真实,马路的反射光影细腻。
- 衣物的动态表现与水花的交互令人印象深刻。
- 明显看到摔倒向前滑行很长一段,且生动的表现出了水面和人物重复接触的动态效果
再来看看一些其他网友的测试视频
prompt:真人版愤怒侏儒男性法师,在充满爆炸和火焰的战场上施展强大的蓝色法术,蓝色和白色,黄昏时分,高分辨率
总结:可灵1.6的进步,无需多言
从上面的案例中可以看到,可灵1.6在物理规律、人物表演和语义理解上都取得了质的飞跃,尤其是在动态动作与复杂场景中展现出了惊人的能力。
优点:
- 物理真实感升级:物理运动规律、毛发动态、水花溅起等细节表现优秀。
- 人物表演力增强:表情、动作和肢体协调感达到新的高度。
- 语义理解精准:复杂Prompt的响应能力显著提升。
不足:
人物在手和脸交叉的场景,多个物体交叉的场景会略有不足。
未来展望:
可灵1.6的表现已经足够惊艳,而随着技术的迭代与优化,后续版本或将为AI视频生成带来颠覆性的改变。从“物理真实”到“情感真实”,可灵的进化路径无疑值得期待。
如果你也对AI视频生成充满好奇,不妨试试 可灵1.6,体验AI创造的奇迹吧!
官网地址:可灵官网
现在就去试试看!
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...