×
img

上海证券:互联网传媒行业周报:周观点:ChatGPT迎看、听、说重磅升级,多模态大模型渐成趋势

发布者:wx****f5
2023-10-05
390 KB 3 页
影视 上海证券
文件列表:
上海证券:互联网传媒行业周报:周观点:ChatGPT迎看、听、说重磅升级,多模态大模型渐成趋势.pdf
下载文档
主要观点美东时间9月25日,OpenAI在官网宣布,对ChatGPT进行重磅升级实现看图、听声音、输出语音内容三大功能。这是OpenAI实现AGI(通用人工智能)战略重要技术环节。未来两周,OpenAI将向Plus和企业版用户提供看、听、说功能。语音功能将在iOS和Android上使用,图片识别全平台可以使用。图像方面,用户可以通过向其展示一张或多张图片提问,或分析复杂图表得出数据,还可以使用APP中的绘图工具高亮标注图中的特定部分。在同日发布的一篇论文中,OpenAI将这一能看图的模型称作GPT-4V(ision)。语音方面,OpenAI与专业配音演员合作,提供5种不同的声音。另外公司还与Spotify展开合作,通过这一功能将播客翻译为其他语言,同时保留播客主持人的声音。安全方面,OpenAI的目标是构建既安全又有益的AGI。ChatGPT逐步推出功能,可以让OpenAI有时间改进,逐步完善安全漏洞、风险。尤其是新的语音技术可在几秒内生成真实的合成声音,可能会为诈骗者提供便利条件,所以安全研发策略对于涉及语音和视觉的高级模型至关重要。近期,ChatGPT流量呈现回升趋势。Simila

加载中...

已阅读到文档的结尾了

下载文档

网友评论>