×
img

开源证券:通信行业周报:AI模型加速迭代升级,重视AI应用带来产业机遇

发布者:wx****5b
2024-05-19
2 MB 18 页
电信 开源证券
文件列表:
开源证券:通信行业周报:AI模型加速迭代升级,重视AI应用带来产业机遇.pdf
下载文档
GPT-4o升级融媒能力,超低延时加速AI应用 2024年5月14日,OpenAI在首次春季发布会发布新旗舰模型“GPT-4o”。相较于GPT-4,GPT-4o进一步提升了文本、图像及语音处理能力,具有多项升级: (1)多模态交互:GPT-4o是一个多模态大模型,支持文本、音频和图像的任意组合输入,并能生成文本、音频和图像的任意组合输出,具备优秀的多模态交互能力,包括语音、视频,以及屏幕共享。视觉识别方面:GPT-4o可以识别复杂的视觉内容,帮助进行图像分类、物体检测等任务;音频处理方面:能够处理多重语音输入,进行语音识别和生成;视频分析方面,GPT-4o可以理解和分析视频内容,进行视频摘要和标注。 (2)超低延时:GPT-4o的响应速度较快快,最短仅需232毫秒,平均为320毫秒,几乎达到了人类在对话中的反应时间。具备超低延时的同时可以实现对话中实时打断AI,增加信息或开启新话题,可以实时识别和理解人类的表情,文字,以及数学公式;交互语音感情丰富,可以变换语音语调、风格,还可以模仿,甚至“即兴”唱歌;并可以在对话中即时翻译多种语言。 (3)多语言支持:GPT-4o语言处理能力加强,在

加载中...

已阅读到文档的结尾了

下载文档

网友评论>