文件列表:
上海证券:互联网传媒行业周报-周观点:七火山开发AI视频模型,OpenAI开源TransformerDebugger.pdf |
下载文档 |
资源简介
>
主要观点
在OpenAI展示创新文生视频模型Sora后,StableVideo上线公测,Pika推出视频对口型的LipSync及可根据内容自动生成声音的音效生成功能,LTXStudio上线电影制作平台,包含视频生成、编辑、剪辑、旁白全流程。3月5日,超讯通信X七火山大会上,Etna发布一段高清4K文生视频,视频长度达到了破纪录的15秒,并且实现了60FPS的超高帧率,提高了视频的流畅性和观看体验。相较于市场上的现有模型,Etna在时长、高清晰度、丰富生动细节和强语义理解上都保持着较大优势,其模型在语言模型和图像模型中插入时空卷积和注意力层,能够处理视频数据、考虑图像序列中的时间连续性,这也就意味着Etna拥有了一定的时空理解能力,能够理解并生成具有时间维度的视频内容。
3月12日,OpenAI开放了自己内部一直用于分析Transformer内部结构的工具TransformerDebugger,该工具结合了自动可解释性和稀疏自动编码器,研究者可以用TDB工具分析Transformer的内部结构,从而对小模型的特定行为进行调查。TransformerDebugger将“稀疏自动编码器”结合
加载中...
已阅读到文档的结尾了