×
img

财通证券:计算机行业专题报告:视频大模型最新进展如何?

发布者:wx****ef
2024-06-19
2 MB 15 页
互联网 财通证券
文件列表:
财通证券:计算机行业专题报告:视频大模型最新进展如何?.pdf
下载文档

Sora 团队的负责人在 2024 智源大会开幕式分享多模态大模型领域近 年来的发展历程以及未来的前进方向。DALL.E:通过压缩数据可以实现 学习,但仅仅压缩并不能通向 AGI;CLIP:从在视觉世界学习过程中介入自 然语言指导,与单纯压缩数据相比计算效率将显著提升;DALL·E 3:增强训 练文本的描述性,训练文生图模型的效率也会更高,即使在推理时无法使用具 有描述性的文本,也可以使用具有较强描述性的文本作为训练的框架得到更 好的无条件模型;视觉上下文学习可能是实现通往所有类型应用的一条可行 路径


加载中...

已阅读到文档的结尾了

下载文档

网友评论>