×
img

五矿证券:电子行业点评:Sora模型横空出世,AIGC行业又一里程碑

发布者:wx****64
2024-02-20
1 MB 7 页
半导体 五矿证券
文件列表:
五矿证券:电子行业点评:Sora模型横空出世,AIGC行业又一里程碑.pdf
下载文档
事件描述 2月16日凌晨,OpenAI发布了文生视频AI模型Sora,可以根据文本提示(prompt)、静态图像或视频直接生成或扩展视频,视频时长可达1分钟。 事件点评 OpenAI发布了具有里程碑意义的文生视频AI模型Sora。Sora能够生成具有多个角色、特定类型的主题和运动,具备准确且高清的细节特征的复杂场景。该模型不仅满足用户在prompt中要求的内容,还了解这些东西在物理世界或数字世界中的存在方式。此外,Sora还可以在单个视频中创建多个镜头,且准确保留角色和视觉风格的一致性和连贯性。当前OpenAI尚未向公众开放,仅向数量有限的红队成员以及艺术家、制作人开放权限。 Sora亮点1:首次提出统一各类视觉数据的——patch,打通了扩散模型和大模型之间的桥梁。为了对齐不同时长、分辨率和纵横比的视觉数据,Sora在训练时先将大量不统一的视频和图像编码为较小的数据单元集合patches,使得Sora可以使用更加广泛的视觉数据来训练扩散模型。Patch的出现打通了扩散模型与transformer架构下大模型之间的桥梁,使得Sora能够在DALL·E和GPT模型技术基础上,生成高质量的

加载中...

已阅读到文档的结尾了

下载文档

网友评论>

开通智库会员享超值特权
专享文档
免费下载
免广告
更多特权
立即开通

发布机构

更多>>