×
img

兴业证券:AI深度洞察系列报告(三):Scale up与Scaleout组网变化趋势如何看?

发布者:wx****7c
2024-09-13
3 MB 24 页
人工智能(AI) 兴业证券
文件列表:
兴业证券:AI深度洞察系列报告(三):Scale up与Scaleout组网变化趋势如何看?.pdf
下载文档

本篇报告是 AI 洞察系列深度第三篇,研究视角聚焦在组网结构,更多从集群 组网变化来分析硬件架构的技术演进趋势以及对算力产业链投资机会影响。  AI 组网走向更大规模集群,单节点和节点间网络性能要求持续提升。AI 网络 由服务器—交换机——光/铜连接硬件构成,Scaling Laws 驱动算力集群规模 快速增长,为迎合更大 AI 集群变化,在单网络节点追求带宽提升,即 Scale up; 在网络整体规模上追求更大承载力,即 Scale out,成为确定性趋势。  Scale up:满足分布式训练通信要求,提升节点带宽,带动节点内部互联需求 提升。大模型训练主要采用分布式训练架构,对应张量并行、流水线并行及 数据并行的混合并行策略,其中张量并行对通信的要求最高,常常发生在服 务器(超节点)内部,做大超节点规模,内部互联带宽提升优先级更高,升 级压力更大。英伟达目前通过 GB200 形态+NVLINK 协议进行超节点规模迭 代并采用铜互连方案,推动铜互联新市场需求爆发。短期铜有望主导 Scale up 互连,长期来看伴随带宽升级,铜互连传输距离限制或推动光互联方案替代。


加载中...

本文档仅能预览20页

继续阅读请下载文档

网友评论>