文件列表:
太平洋证券:计算机软件行业周报:Sora和Gemini 1.5发布,多模态大模型更进一步.pdf |
下载文档 |
资源简介
>
报告摘要
OpenAI发布视频生成模型Sora,AI视频生成迎来里程碑。2月16日,OpenAI宣布推出全新的生成式人工智能模型“Sora”。Sora是一种通用的视觉数据模型,能够生成各种持续时间、宽高比和分辨率的视频和图片。与此前的视频生成模型相比,Sora主要实现了以下突破:1)视频时长达到60秒:Sora可以通过文本指令直接输出长达60秒的视频,并保持视频主体与背景的高度流畅性与稳定性。2)文本的深度理解能力:Sora可以准确理解用户的文本指令,无论是复杂的动作场景还是细腻的情感表达,Sora都能够精确捕捉并展现。3)对真实世界的理解:Sora对物理规律的遵循程度较高,对于光影反射、运动方式、镜头移动等细节的呈现效果较为逼真。4)长序列连贯性和目标持久性:Sora能在单个视频中生成同一角色的多个镜头,并在整个视频中保持其外观。即使人、动物和物体被遮挡或离开画面,Sora模型也能使其保持不变。
谷歌发布Gemini1.5Pro,上下文长度突破百万。2月15日,谷歌宣布了下一代大模型Gemini1.5Pro。Gemini1.5Pro是一种中型多模态模型,针对多种任务的扩展进行了优化,
加载中...
已阅读到文档的结尾了