×
img

上海证券:互联网传媒行业周报-周观点:七火山开发AI视频模型,OpenAI开源TransformerDebugger

69
2024-03-20
353 KB 3 页
影视 上海证券
文件列表:
上海证券:互联网传媒行业周报-周观点:七火山开发AI视频模型,OpenAI开源TransformerDebugger.pdf
下载文档
主要观点 在OpenAI展示创新文生视频模型Sora后,StableVideo上线公测,Pika推出视频对口型的LipSync及可根据内容自动生成声音的音效生成功能,LTXStudio上线电影制作平台,包含视频生成、编辑、剪辑、旁白全流程。3月5日,超讯通信X七火山大会上,Etna发布一段高清4K文生视频,视频长度达到了破纪录的15秒,并且实现了60FPS的超高帧率,提高了视频的流畅性和观看体验。相较于市场上的现有模型,Etna在时长、高清晰度、丰富生动细节和强语义理解上都保持着较大优势,其模型在语言模型和图像模型中插入时空卷积和注意力层,能够处理视频数据、考虑图像序列中的时间连续性,这也就意味着Etna拥有了一定的时空理解能力,能够理解并生成具有时间维度的视频内容。 3月12日,OpenAI开放了自己内部一直用于分析Transformer内部结构的工具TransformerDebugger,该工具结合了自动可解释性和稀疏自动编码器,研究者可以用TDB工具分析Transformer的内部结构,从而对小模型的特定行为进行调查。TransformerDebugger将“稀疏自动编码器”结合

加载中...

已阅读到文档的结尾了

下载文档

网友评论>

开通智库会员享超值特权
专享文档
免费下载
免广告
更多特权
立即开通

发布机构

更多>>
VIP会员特权:
阅读时无遮挡广告;尊享专属客服;... 了解更多