文件列表:
国金证券:通信行业研究:DeepSeek算力效率提升≠算力通缩,国产算力需求方兴未艾.pdf |
下载文档 |
资源简介
>
DeepSeek在知乎发布文章《DeepSeek-V3/R1推理系统概览》,披露其AI大模型的理论成本利润率高达545%,引发业内的热烈讨论。在本篇报告中,我们从以下三个角度:1)DeepSeek的底层架构优化;2)DeepSeek的利润率详细拆解;3)DeepSeek引发的算力需求之争,回应市场关心的问题。此外,当前市场针对算力之争多定性分析,本篇报告也旨在提供较完整的定量分析框架以供参考。
DeepSeek通过大规模专家并行与计算通信重叠提升算力效率:
大规模专家并行模式下,专家参数被存储在多个GPU中,集群处理并行请求能力得到增强,GPU算力资源利用率也得到了提高。但在此模式下,通信耗时增加,因此DeepSeek还采用算通信重叠策略以缓解该问题。我们认为AI大模型具有规模效应:通过底层架构优化后,伴随批量大小的增加,计算与通信的时间边际下降,吞吐率得到提升。因此大规模集群能提高算力利用率。
参考DeepSeek,我们认为MaaS厂商具有盈利潜力,率先实现规模效应的云厂商将脱颖而出:
我们对DeepSeek披露的545%高利润率进行了拆解,以进一步分析利润率的影响因素。545%是成
加载中...
本文档仅能预览20页