×
img

华鑫证券:计算机行业周报:豆包实时语音大模型和大模型1.5线,美政府联手科技巨头启动“星际之门”

发布者:wx****00
2025-01-31
797 KB 15 页
互联网 华鑫证券
文件列表:
华鑫证券:计算机行业周报:豆包实时语音大模型和大模型1.5线,美政府联手科技巨头启动“星际之门”.pdf
下载文档
投资要点 算力:恒源云13核+128G算力紧张 本周恒源云13核+128G算力紧张。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G算力紧张;阿里云16核+125GiB价格为34.74元/时;显卡配置为A800-80G中,恒源云16+256G价格为9.00元/时。 AI应用:豆包团队发布最新实时语音大模型和大模型1.5Pro版本 1月20日,字节跳动旗下的豆包团队正式发布了豆包实时语音大模型,这是一款语音理解和生成一体化的模型,实现了端到端的语音对话。与传统的级联模式相比,该模型在语音表现力、控制力、情绪承接方面表现出色,具备低时延、对话中可随时打断等特性。这些特性使得模型在实际应用中更加灵活和高效,能够更好地满足用户在不同场景下的需求。在架构方面,豆包团队研发了端到端的框架,深度融合语音与文本模态,面向语音生成和理解进行统一联合建模,实现多模态输入和输出效果。模型支持多种模式,包括语音到语音(S2S)、语音到文本(S2T)、文本到语音(T2S)、文本

加载中...

已阅读到文档的结尾了

下载文档

网友评论>