×
img

信达证券:电子:世界模型探索空间智能,AI复杂场景落地可期

发布者:wx****03
2025-03-05
2 MB 16 页
半导体 信达证券
文件列表:
信达证券:电子:世界模型探索空间智能,AI复杂场景落地可期.pdf
下载文档
本期内容提要: 世界模型研究进展迅速,应用端机遇与挑战并存。长期以来,科学界一直渴望开发一个统一的模型,该模型可以复制其世界的基本动态,以追求通用人工智能(AGI)。世界模型尚无统一的定义,英伟达官网的定义为:“世界模型是理解现实世界动态(包括其物理和空间属性)的生成式AI模型。它们使用文本、图像、视频和运动等输入数据来生成视频。通过学习,它们能够理解现实世界环境的物理特性,从而对运动、应力以及感官数据中的空间关系等动态进行表示和预测。”Sora发布之后,世界模型获得了更为广泛的关注。从功能方面看,在许多用例中,Sora确实具备一定的理解和预测世界的能力,且其生成的视频在大部分时候也能有良好的一致性。但也有人认为Sora仅是像素层面的生成,这会导致一些无法解释的现象,这表明Sora并未理解物理世界。从技术架构看,Sora是一种基于扩散的视频生成模型。但是无论如何,Sora的结果表明,扩展视频生成模型是构建物理世界通用模拟器的一条有前景的途径。应用层面看,随着视觉生成模型和多模态大模型的进展,世界模型在自动驾驶领域受到了广泛的关注。使用基于扩散的视频生成模型作为世界模型可以部分解决信息丢

加载中...

已阅读到文档的结尾了

下载文档

网友评论>