×
img

中泰证券:人工智能行业双周报:OpenAI发布视频生成模型Sora,Google推出多模态Gemini 1.5版本

80
2024-02-21
847 KB 15 页
互联网 Google 中泰证券
文件列表:
中泰证券:人工智能行业双周报:OpenAI发布视频生成模型Sora,Google推出多模态Gemini 1.5版本.pdf
下载文档
投资要点 OpenAI发布首个视频模型Sora,可以根据用户输入的文本生成长达一分钟的高清视频。Sora生成的视频可具有多个角色,特定类型的运动及主体和背景的准确细节的复杂场景。通过让模型一次性预测多帧画面,该模型可以确保被摄主体即使短暂离开镜头也可以保持不变,从而在单个生成的视频中创造多个分镜,并准确的保留角色和视觉风格。此外,Sora还可以根据现有的静态图像生成视频,并对图像内容进行动画处理;提取现有视频,并对其进行扩展或填充缺失的帧。 谷歌推出大模型Gemini1.5,性能显著增强。Gemini1.5建立在谷歌对Transformer和MoE架构的研究上,传统的Transformer作为一个大型神经网络,MoE模型则被分为更小的专家神经网络。根据给定输入的类型,MoE模型将选择性地仅激活其神经网络中最相关的专家路径。这种专业化极大地提高了模型的效率。性能方面,Gemini1.5可持续运行多达100万个tokens,该模型可以一次性处理处理大量信息,包括1小时的视频、11小时的音频、超过3万行代码或超过70万字的代码库。 投资建议:人工智能新一轮十年级的技术和产业革命大幕已经拉开,

加载中...

已阅读到文档的结尾了

下载文档

网友评论>

开通智库会员享超值特权
专享文档
免费下载
免广告
更多特权
立即开通

发布机构

更多>>
VIP会员特权:
阅读时无遮挡广告;尊享专属客服;... 了解更多