文件列表:
国联证券:传媒:GPT-4o发布,关注强交互场景落地.pdf |
下载文档 |
资源简介
>
行业事件:
北京时间5月14日凌晨,美国人工智能公司OpenAI发布新一代旗舰生成模型GPT-4o、桌面App,并重点展示了突破性的语音交互能力。
GPT-4o交互能力实现突破,“拟人化”程度进一步提升
从产品效果来看,GPT-4o在实时语音交互领域实现突破性进展,为用户提供更为自然、准确的交互体验:1)用户可以随时打断模型,而不需要等到其结束才开始说话,交互更加符合人类交互逻辑;2)实时响应能力大幅提升,模型具有实时响应的能力,不会出现用户长时间等待模型给出响应的尴尬情况;3)模型具有情绪感知能力,能够生成不同情绪风格的语音,交互更加拟人。基于GPT-4o强大的交互能力,发布会中展示了丰富的应用场景,包括声情并茂地讲情感故事、实时视频对话、实时音频翻译等。从技术层面看,GPT-4o采用了全新技术,所有的输入和输出都由同一个神经网络处理,从而实现文本、视觉和音频端到端的训练。
AIC端应用有望加速落地,重点关注社交、游戏、教育领域2024年以来,多模态能力成为生成式AI的重点攻坚方向,而OpenAI作为头部企业,在技术和产品层面持续引领行业发展。2024年2月OpenAI发布Sora以
加载中...
已阅读到文档的结尾了