在人工智能领域,技术迭代的速度总是令人惊叹。快手旗下AI视频生成工具可灵(Kling)在短短半年内,从追赶者一跃成为全球AI视频生成领域的领跑者。最新发布的1.6版本,展现了令人瞩目的技术进步。

尽管版本号仅提升了0.1,但可灵1.6版带来的技术突破却远超预期。新版本在保持35灵感/5秒视频的亲民价格基础上,在三个核心维度实现了质的飞跃:物理规律真实感、人物表演能力和语义理解水平。

物理规律真实感大幅提升

对物理世界的精准演绎是这次更新的最大亮点。在切西红柿的测试中,可灵1.6版展现出近乎专业厨师的精准操作,无论是刀具与食材的互动,还是切片的力度都令人叹服。倒茶、猫咪踩沙发、狗狗奔跑等日常场景中的物理效果也更加真实。甚至连蝙蝠侠飙车时披风的飘动都充满了电影感,真实度和艺术感兼具。

人物表情和动作的进步同样令人惊艳。从细微的眉头皱起到优雅的芭蕾舞姿,再到极具挑战的中国古典水下舞蹈,可灵1.6版都能准确捕捉人物细微的情感变化和复杂的肢体动作。在河南卫视《洛神》水下舞蹈片段的重现中,舞者的动作幅度和服饰飘带的物理效果都达到了惊人的水准。

在语义理解方面,可灵1.6版展现出更强的场景理解能力。无论是“摘下眼镜拥抱小鹿”这样的连续动作,还是“后退举枪”等复杂场景,都能准确理解并生成符合预期的视频内容,体现了其对复杂指令的出色解析能力。

当然,作为0.1版本的更新,可灵1.6版仍有提升空间。例如,在生成原图之外的内容时,画风的统一性还需加强;多人物场景下的手部细节处理仍有待改进。但这瑕不掩瑜,这次更新已经充分展示了可灵团队扎实的技术功底和快速迭代的能力。

从6月份正式上线至今,可灵在短短半年内完成了从“中国的Sora”到“世界的可灵”的蜕变。在全球AI视频生成赛道上,这个来自快手的产品正在书写属于中国科技的新篇章。我们有理由相信,在即将到来的2.0版本中,可灵还将带给我们更多惊喜。