×
img

太平洋证券:传媒互联网行业周报:关注人机交互方式变革下的三条主线

发布者:wx****20
2024-05-20
1 MB 21 页
影视 太平洋证券
文件列表:
太平洋证券:传媒互联网行业周报:关注人机交互方式变革下的三条主线.pdf
下载文档
报告摘要 OpenAI发布混合多模态模型GPT-4o,变革人机交互方式OpenAI发布混合多模态模型GPT-4o,该模型是OpenAI探索提升模型易用性的新成果,是一个集成文本、图片、视频、语音的全能模型。GPT-4o改变了人机交互方式,在功能上体现为具备实时语音及视频交互能力:1)在语音交互方面,GPT-4o响应音频输入的平均时间与人类对话的反应速度一致,实现实时的复杂对话、语音翻译、通过语音识别说话者情绪等功能;2)在视频交互方面,具备更复杂的多模态交互能力,实现实时识别视频拍摄内容,并给予反馈等功能。同时发布GPT-4oAPI,速度提高2倍,价格便宜50%,调用模型的速率限制较GPT-4-Turbo提高了5倍。 谷歌发布多项新成果,ProjectAstra实现视觉和语音交互谷歌I/O大会发布多项新成果:1)混合多模态模型发布:ProjectAstra具备与GPT-4o不相上下的视觉识别和语音交互效果,能够帮助用户整合工作流,提升效率;2)AIOverview重塑谷歌搜索:允许用户通过提问和聊天的方式进行AI驱动的搜索,且用户无需自行查阅结果,可由AIOverview代办一切;3)

加载中...

本文档仅能预览20页

继续阅读请下载文档

网友评论>