×
img

国海证券:计算机行业动态研究:GPT-4o、Gemini新品接连发布,多模态技术奇点加速到来

发布者:wx****a4
2024-05-16
1 MB 19 页
互联网 国海证券
文件列表:
国海证券:计算机行业动态研究:GPT-4o、Gemini新品接连发布,多模态技术奇点加速到来.pdf
下载文档
事件: 2024年5月14日,OpenAI在官网正式发布新旗舰模型GPT-4o多模态大模型,其中o代表的是omni,即“全能”,GPT-4o可以实时对音频、视觉和文本进行推理,相较于GPT-4Trubo速度更快、价格更便宜。 2024年5月15日,2024年谷歌I/O大会正式召开,会上谷歌将搜索业务做了最彻底的AI改造,更新升级了Gemini1.5Pro版本,推出 Gemini1.5Flash轻量化小模型、生成视频模型Veo、AI智能体ProjectAstra,并展示了与GPT-4o相似的语音视觉交互功能GeminiLive。 投资要点: GPT持续迭代,GPT-4o推动人机交互再上新台阶 OpenAI持续升级GPT版本,2023年3月发布GPT-4在图片识别、图文数据综合处理及逻辑推理等能力实现质变;2023年11月发布GPT-4Turbo,支持125万tokens的同时也在上下文等多个领域实现显著进步。本次发布GPT-4o带来各种能力升级: ①多模态交互,具有更优质的视频和音频理解以及图像生成能力:GPT-4o能够接受文本、音频和视频的任意组合作为输入,并生成文本、音频和图像的任意

加载中...

已阅读到文档的结尾了

下载文档

网友评论>