文件列表:
民生证券:传媒行业事件点评:OpenAI发布文生视频模型Sora,重视内容生产工具层革新.pdf |
下载文档 |
资源简介
>
事件
2月16日凌晨,OpenAI发布首个文生视频模型Sora。据官网技术文档介绍,Sora的核心能力在于文本理解和物理模拟,其能够处理复杂的文本描述,理解场景背后的情感和动态,并生成高质量的视觉内容。Sora可以生成不同时长、不同宽高比、不同分辨率以及最高60秒的视频戒图像。目前,Sora目前仅向创作者部分开放。
OpenAI发布Sora模型,视频编辑以及物理模拟能力出色
1)采样灵活性:Sora采用原生大小对数据进行训练,可对不同宽高比的视频素材进行采样。此外,Sora可以在全分辨率视频生成之前以较小的尺寸快速制作demo。2)改进构图和取景:由于Sora以原始纵横比对视频进行训练,可以改善构图和取景。3)言诧理解:Sora应用DALL·E3,通过训练高度描述性的字幕器模型将视频生成文本字幕,还利用GPT将简短的用户提示转换为更长的详细字幕,以根据提示生成高质量的视频。4)图像和视频编辑:可将图像戒视频输入Sora,从而进行图像和视频编辑。例如,创建循环视频、为静态图像制作动画、向前戒向后扩展视频。5)物理模拟:Sora能够模拟物理世界中人、动物和环境的交互。包括3D一致性、长期连
加载中...
已阅读到文档的结尾了