×
img

国金证券:计算机行业研究:全球多模态基模抵近GPT3.5时刻,关注多模态产品化机会

发布者:wx****df
2025-10-12
1 MB 10 页
互联网 国金证券
文件列表:
国金证券:计算机行业研究:全球多模态基模抵近GPT3.5时刻,关注多模态产品化机会.pdf
下载文档
本周观点 10月1日,OpenAI正式发布新一代AI视频模型Sora2及首款社交应用SoraApp。Sora2在物理一致性、音画同步、角色连贯性等方面实现重大突破,被誉为“视频生成的GPT-3.5时刻”。用户可通过SoraApp将自己“投影”进任意AI生成场景,实现互动式视频创作。Sora2支持多镜头、跨场景叙事及高保真音效生成,分为Sora2和Sora2Pro两个版本,前者主打快速创作,后者面向专业级内容制作。10月5日,腾讯混元团队发布并开源仅一周的原生多模态文生图模型——混元图像3.0,超越谷歌Nano-Banana与字节Seedream4.0,位列文生图综合榜与开源榜第一。该模型参数量达80B(推理时激活13B),生成效果媲美顶级闭源模型。实测显示,混元图像3.0具备知识理解、逻辑推理与创意生成能力,文字渲染与画面构图显著提升。10月7日,OpenAI在开发者大会2025上发布多项重磅更新,包括AgentKit、Codex正式版、ChatGPT内置应用与AppsSDK、gpt-realtime-mini、gpt-image-1-mini、Sora2API及GPT-5proAPI

加载中...

已阅读到文档的结尾了

下载文档

网友评论>