爱建证券：人工智能月度跟踪：OpenAI推出新一代音视频工具Sora2

发布者：wx****af

2025-10-21

785 KB 9 页

消费电子爱建证券

文件列表：

爱建证券：人工智能月度跟踪：OpenAI推出新一代音视频工具Sora2.pdf

下载文档

资源简介

投资要点：引子：2025年9月30日，OpenAI推出新一代音频、视频生成模型Sora2，并同步上线独立iOS应用。Sora2被OpenAI誉为"视频领域的GPT-3.5时刻"，此次更新不仅在视频生成质量上实现了显著提升，更首次支持了与画面精准匹配的原生音频生成，标志着AI视频生成技术迈入一个全新的发展阶段。 Sora采用DIT架构，性能优于同期发布模型。2024年2月16日，OpenAI发布首个文本生成视频模型Sora，其核心采用DiffusionTransformer深度融合架构，依托自注意力机制等设计，可增强视频帧间连贯性与文本与视觉语义的匹配精准度。相较于Gen-2、Lumiere等同期模型，Sora的优势尤为突出：1）生成时长达60秒，远超Gen-2（18秒）、Lumiere（5秒）、MoonValley（6秒）的上限，能承载更具叙事性的创作需求；2）生成类型覆盖T2V（文生视频）、I2V（图生视频）、V2V（视频生视频），并额外支持VFI（视频插帧），多模态创作能力更全面；3）技术架构上，凭借DiffusionTransformer的特性，时序一致性表现更佳，可减少画面闪

加载中...

已阅读到文档的结尾了

下载文档