太平洋证券：计算机行业周报：多模态大模型持续迭代，宝马搭载国产AI模型

发布者：wx****17

2025-03-31

1 MB 11 页

互联网太平洋证券

文件列表：

太平洋证券：计算机行业周报：多模态大模型持续迭代，宝马搭载国产AI模型.pdf

下载文档

资源简介

报告摘要 GPT-4o上线多模态生图功能，实用性大幅提升。OpenAI发布GPT-4o原生多模态图像生成功能，支持一分钟内生成逼真图像，取代DALL-E3成为ChatGPT默认图像引擎。新功能优势包括精准渲染文字、执行复杂指令、保持视觉一致性和支持多种艺术风格，已向大部分用户开放。GPT-4o生图在多个领域展现出强大的应用潜力，在海报制作、插画绘制、UI设计、电商宣传图绘制等场景中表现出较高水平。由于使用GPT-4o生图的需求过高，OpenAI创始人SamAltman表示，目前GPU负荷过大，在努力提高效率的同时，将暂时对ChatGPT生成图片的功能引入一些速率限制，并将推迟向免费用户开放新功能的时间。阿里发布多模态大模型Qwen2.5-Omni，支持语音、视频交互。阿里发布多模态大模型Qwen2.5-Omni，采用Apache2.0许可证开源7B参数版本，支持文本、图像、音频和视频多模态输入输出。该模型创新设计Thinker-Talker架构实现实时语音视频聊天，并提出TMRoPE技术同步视频与音频时间戳，适合手机等终端设备部署。模型性能超越同等大小的单模态模型，在OmniBenc

加载中...

已阅读到文档的结尾了

下载文档