中泰证券：人工智能行业双周报：OpenAI发布视频生成模型Sora，Google推出多模态Gemini 1.5版本

发布者：wx****

2024-02-21

847 KB 15 页

互联网 Google 中泰证券

文件列表：

中泰证券：人工智能行业双周报：OpenAI发布视频生成模型Sora，Google推出多模态Gemini 1.5版本.pdf

下载文档

资源简介

投资要点 OpenAI发布首个视频模型Sora，可以根据用户输入的文本生成长达一分钟的高清视频。Sora生成的视频可具有多个角色，特定类型的运动及主体和背景的准确细节的复杂场景。通过让模型一次性预测多帧画面，该模型可以确保被摄主体即使短暂离开镜头也可以保持不变，从而在单个生成的视频中创造多个分镜，并准确的保留角色和视觉风格。此外，Sora还可以根据现有的静态图像生成视频，并对图像内容进行动画处理；提取现有视频，并对其进行扩展或填充缺失的帧。谷歌推出大模型Gemini1.5，性能显著增强。Gemini1.5建立在谷歌对Transformer和MoE架构的研究上，传统的Transformer作为一个大型神经网络，MoE模型则被分为更小的专家神经网络。根据给定输入的类型，MoE模型将选择性地仅激活其神经网络中最相关的专家路径。这种专业化极大地提高了模型的效率。性能方面，Gemini1.5可持续运行多达100万个tokens，该模型可以一次性处理处理大量信息，包括1小时的视频、11小时的音频、超过3万行代码或超过70万字的代码库。投资建议：人工智能新一轮十年级的技术和产业革命大幕已经拉开，

加载中...

已阅读到文档的结尾了

下载文档