文件列表:
华金证券:计算机行业快报:OpenAI重磅发布Sora,视频生成领域的里程碑.pdf |
下载文档 |
资源简介
>
投资要点
2月16日,OpenAI重磅发布文生视频模型Sora,Sora在视频时长与视觉效果等方面相较于Pika、Runway等主流文生视频工具有了极大幅度的提升。具体来看,Sora生成的视频具有超长时长、世界模型、多镜头切换的三大特性:
1)超长时长:Sora可生成长达一分钟的高清视频,而此前Pika、Runway等模型生成的视频时长仅在20s以内,在视频时长大幅提升的同时,视频具有连贯性,即使人物和其他场景元素被暂时遮挡或离开视野,仍能保持一致性;
2)世界模型:Sora不仅能够深入理解用户提示,还学会了物理世界的部分规律,比如一个人吃汉堡后会留下咬痕、火车车窗上会产生逼真的倒影,而Runway等模型的拟真程度则相对较弱;
3)多镜头切换:Sora可在单个视频中设计出多个镜头,并且能在多角度的镜头切换中,实现角色和视觉风格的一致性,而Runway等绝大部分模型只能生成单镜头视频。
相较于此前的视频生成模型,Sora在底层模型和算法上的创新点主要体现在以下三个方面:
1)采用Transformer架构的扩散模型:不同于RunwayGen1、StableVideoDiffusion等扩
加载中...
已阅读到文档的结尾了