文件列表:
太平洋证券:传媒互联网行业点评:Sora横空出世,关注内容资产价值重估下的两条投资主线.pdf |
下载文档 |
资源简介
>
OpenAI迈入视频领域,文生视频大模型Sora发布
2月16日,OpenAI发布最新文生视频大模型Sora,并在官网发布由其生成的48个视频样例。目前,Sora仍处于测试阶段,仅对部分评估人员、视觉艺术家、设计书和电影制作人开放访问权限。
Sora在视频生成和模拟能力实现重大突破。基于通用视觉数据的模型Sora具有强大的功能,具体来看:1)视频生成和处理能力:生成长达1分钟的视频,远超此前Pika的7秒、RunawayGen2的18秒,视频画面的表现和构图效果更佳。并且,生成视频具有3D一致性,即可生成具有动态摄像机运动的视频,随着摄像机的移动和旋转,人物和场景元素在3D空间中保持一致移动。2)图像生成能力:生成不同大小、分辨率最高可达2048x2048像素的图片。3)模拟能力:在3D空间中模拟人类、动物、自然环境的特征,生成视频符合物理世界的规则。并且还能模拟数字世界、生成程序游戏。
Sora采用Transformer架构,并用patches作为训练和预测的基本单位。1)数据处理:类比于大语言模型将各种文本统一为tokens,Sora将不同的视频和图片等视觉数据压缩在低维潜空间中,
加载中...
已阅读到文档的结尾了