×
img

万联证券:计算机行业跟踪报告:OpenAI推出首个文生视频大模型Sora,引领AI文生视频行业跨越式发展

发布者:wx****e9
2024-02-19
2 MB 10 页
SaaS 万联证券
文件列表:
万联证券:计算机行业跟踪报告:OpenAI推出首个文生视频大模型Sora,引领AI文生视频行业跨越式发展.pdf
下载文档
行业核心观点: 文生视频大模型Sora重磅发布,可生成长达1分钟的视频。2月16日,OpenAI推出其首个文生视频大模型Sora。根据官网介绍,Sora可以生成长达1分钟时长的视频,同时还能保证视频质量,并遵循用户的提示(prompt)。 投资要点: Sora是一个扩散transformer,具有强大的语言理解能力,通过在潜在空间训练patches生成视频。对标tokens,OpenAI将视觉数据转换为patches,有效用于Sora大模型训练。Sora是一种扩散模型,通过给出输入的静态噪声以及相关的文本提示(prompt)等调节信息,训练生成原始的“干净”patches。在推理时,OpenAI还可以通过在适当大小的网格中排列随机初始化的patches来控制生成视频的大小。与GPT模型类似,Sora使用transformer架构,释放出卓越的扩展性能。立足DALL·E3和GPT模型,Sora具有强大的语言理解能力,能够生成更加准确遵循用户提示的高质量视频。此外,在固定种子和输入的情况下,可以看到训练计算的增加能显著提升样本视频的质量。 多维度跨越式突破,视频质量飞跃性提升。Sora的采

加载中...

已阅读到文档的结尾了

下载文档

网友评论>