文件列表:
爱建证券:人工智能月度跟踪:OpenAI推出新一代音视频工具Sora2.pdf |
下载文档 |
资源简介
>
投资要点:
引子:2025年9月30日,OpenAI推出新一代音频、视频生成模型Sora2,并同步上线独立iOS应用。Sora2被OpenAI誉为"视频领域的GPT-3.5时刻",此次更新不仅在视频生成质量上实现了显著提升,更首次支持了与画面精准匹配的原生音频生成,标志着AI视频生成技术迈入一个全新的发展阶段。
Sora采用DIT架构,性能优于同期发布模型。2024年2月16日,OpenAI发布首个文本生成视频模型Sora,其核心采用DiffusionTransformer深度融合架构,依托自注意力机制等设计,可增强视频帧间连贯性与文本与视觉语义的匹配精准度。相较于Gen-2、Lumiere等同期模型,Sora的优势尤为突出:1)生成时长达60秒,远超Gen-2(18秒)、Lumiere(5秒)、MoonValley(6秒)的上限,能承载更具叙事性的创作需求;2)生成类型覆盖T2V(文生视频)、I2V(图生视频)、V2V(视频生视频),并额外支持VFI(视频插帧),多模态创作能力更全面;3)技术架构上,凭借DiffusionTransformer的特性,时序一致性表现更佳,可减少画面闪
加载中...
已阅读到文档的结尾了