AI影像生成重大变革!谷歌推模型Veo 2 保证不会出现「6根手指」

▲谷歌推出全新的人工智慧影像生成器「Veo 2」。(图/翻摄自YouTube)

记者罗翊宬/综合报导

如今全球高度关注人工智慧(AI)的发展,为了不让OpenAI专美于前,由Google所收购的人工智慧公司「Google DeepMind」于当地时间16日再度发表新版影片生成工具Veo 2,实现不同的镜头和电影效果,能更加细微呈现人类的表情变化,真实模拟运动、流体力学、光的特性,解析度比OpenAI的Sora模型高出4倍。

综合外媒报导,Google DeepMind于16日发表新版影片生成工具「Veo 2」,其生成影片的解析度最高可以达到4K(4096×2160)、影片时长为2分钟,在解析度上是Sora模型的4倍、影片生成时长则为Sora的6倍,其大幅提升实体世界物理作用、人类表情细微差异、人类运动上的理解程度,使得生成影片变得更加细致,提高真实性。

其中,用户只需指定文类、镜头与想要的影像效果,包括可以要求从场景中间以低角度平移追踪,或是某位科学家观看显微镜时的脸部特写,以及从用户所输入的18mm镜头的提示要求,达到生成此常用镜头的广角影像,而若是输入「浅景深」,则能达到背景模糊、焦点集中在主题上的效果。

在影像的生成过程中,能够大幅降低「多余的手指头」(6根手指)等AI常见错误的出现频率。Veo 2的出现,使AI影片创作方面产生重大变革,使Google成为AI生成视觉效果的佼佼者,为创作者提供专业级工具,重塑影像生成的未来。