文件列表:
华福证券:传媒:实时语音Her:AI音箱崛起.pdf |
下载文档 |
资源简介
>
投资要点:
一、实时语音Her:OpenAI先行,国产模型紧随跟进
1、OpenAIAdvace和GeminiLive:根据智东西,7月31日,GPT-4o的高级语音功能正式开放给部分会员用户,预期秋季全面开放。根据新智元,8月15日,GeminiLive现已成为GooglePixel9的默认助手,并向所有Gemini高级订阅用户开放Android版本。
2、智谱清言、讯飞星火:根据新智元,8月30日,讯飞星火推出拟人交互的实时语音—小星畅聊。根据搜狐科技,8月30日,智谱清言APP上线视频通话功能,国产视频版“Her”来了。
二、语音助手的进阶——叠加“AI视频分析”:实时语音+视觉分析
1、AI视频分析技术已成熟,只要算力足够,效果较为显著:AI视频分析使用的是抽帧,目前一般是一秒一帧(实际可能是2S~3S是1帧),目前平均每秒视频花费tokens数值为300左右。在实际使用过程中,算力越是充足,抽帧的数量越多,解析的效果也较好。
2、GPT4o的AI视频案例分析:GPT4o开着视频看着数学题,可以进行数学题进行交流。
3、智谱的AI视频分析:根据量子位,拿智普APP去拍《黑神话:
加载中...
已阅读到文档的结尾了