×
img

申港证券:计算机行业研究周报:从技术路线谈AI视频的未来发展

发布者:wx****03
2023-12-19
1014 KB 9 页
互联网 申港证券
文件列表:
申港证券:计算机行业研究周报:从技术路线谈AI视频的未来发展.pdf
下载文档
本周我们从技术路线来对近期爆火的AI视频进行展望。自Pika爆火出圈后,越来越多的AI视频软件接踵而至,Pika的测评也出现了明显的口碑分化,市场主流观点认为视频生成领域也迎来了GPT时刻。从AI视频的技术迭代的路线看,我们认为:从参与玩家的类型来看,整体是科技大厂居多,并没有出现如文生图模型一样的的现象,背后的原因在于文生视频的门槛较高。从训练数据层来看,AI视频训练数据集的呈现跨模态的形式,以Runway的视频生成模型Gen-2为例,训练数据包括2.4亿张图片、640万个视频剪辑片段以及数亿个学习示例。从形式来看,目前大多数模型厂商在文生视频上以闭源路线居多,其原因在于文生视频对算力及模型的工程化能力都很高。文生视频模型背后其实有两条技术路线:一条是从文本或图像生成中得到广泛的应用,基于Transformer架构的技术路线,而另一条则是基于我们在之前的周报中有所提及的扩散模型,两条技术交替,目前扩散模型占据主流。Google发布的Transformer架构已经在许多不同领域取得了较大的成功,但实际上包括最近的Pika在内,视频生成的主导范式依然是扩散模型。其原因在于Transfor

加载中...

已阅读到文档的结尾了

下载文档

网友评论>