2月16日一早,OpenAI悄无声息地发布了第一个文本生成视频大模型——Sora,犹如一颗核弹迅速引爆全球各大媒体,朋友圈更是直接炸锅,其带来的冲击力,不亚于去年初爆火的ChatGPT。
去年笔者使用过一款Runway的AI应用来生成视频,当时的Runway已经是几款视频生成应用里的佼佼者,但与Sora的演示视频相比,简直不在一个等级,无论从视频生成时长(Runway只能生成几秒)还是动效和镜头运用,和Sora的60秒视频一比,就像弹弓和狙击枪的不同,代差不在一个数量级上。
Sora依托了两项核心技术的重大突破——SpacetimePatch(时空Patch)技术和DiffusionTransformer(扩散型Transformer神经网络)架构,OpenAI将Sora定位为一款世界模拟器的视频
[详细...]