文件列表:
国海证券:计算机行业动态研究:GPT-4o、Gemini新品接连发布,多模态技术奇点加速到来.pdf |
下载文档 |
资源简介
>
事件:
2024年5月14日,OpenAI在官网正式发布新旗舰模型GPT-4o多模态大模型,其中o代表的是omni,即“全能”,GPT-4o可以实时对音频、视觉和文本进行推理,相较于GPT-4Trubo速度更快、价格更便宜。
2024年5月15日,2024年谷歌I/O大会正式召开,会上谷歌将搜索业务做了最彻底的AI改造,更新升级了Gemini1.5Pro版本,推出
Gemini1.5Flash轻量化小模型、生成视频模型Veo、AI智能体ProjectAstra,并展示了与GPT-4o相似的语音视觉交互功能GeminiLive。
投资要点:
GPT持续迭代,GPT-4o推动人机交互再上新台阶
OpenAI持续升级GPT版本,2023年3月发布GPT-4在图片识别、图文数据综合处理及逻辑推理等能力实现质变;2023年11月发布GPT-4Turbo,支持125万tokens的同时也在上下文等多个领域实现显著进步。本次发布GPT-4o带来各种能力升级:
①多模态交互,具有更优质的视频和音频理解以及图像生成能力:GPT-4o能够接受文本、音频和视频的任意组合作为输入,并生成文本、音频和图像的任意
加载中...
已阅读到文档的结尾了