开源证券：传媒行业点评报告：多模态模型再迎新突破，继续布局AI应用及算力

发布者：wx****6c

2024-02-18

744 KB 4 页

游戏开源证券

文件列表：

开源证券：传媒行业点评报告：多模态模型再迎新突破，继续布局AI应用及算力.pdf

下载文档

资源简介

OpenAI发布首个文生视频模型Sora，可输出长达60秒的视频 2月16日凌晨，OpenAI发布了首个文生视频模型Sora。Sora可以直接输出长达60秒的视频，并且包含高度细致的背景、复杂的多角度镜头，以及富有情感的多个角色。目前官网上已经更新了48个视频demo，在这些demo中，Sora不仅能准确呈现细节，还能理解物体在物理世界中的存在，并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。整体来看，Sora生成的视频噪音比较少，原始的训练数据比较“干净”，而且基于ChatGPT、DALL·E文生图技术能力，Sora视频生成技术更加高超。此外，OpenAI表示，他们正在教AI理解和模拟运动中的物理世界，目标是训练模型来帮助人们解决需要现实世界交互的问题。谷歌发布Gemini1.5，多模态能力大幅增强 2月16日，谷歌宣布推出Gemini1.5。谷歌现在推出的是用于早期测试的Gemini1.5的第一个版本-Gemini1.5Pro。它是一种中型多模态模型，针对多种任务的扩展进行了优化，其性能水平与谷歌迄今为止最大的模型1.0Ultra类似

加载中...

已阅读到文档的结尾了

下载文档