文件列表:
天风证券:半导体行业专题研究:AI存储革命已至,“以存代算”开启存储新纪元.pdf |
下载文档 |
资源简介
>
“以存代算”发展背景:AI推理成价值核心,HBM瓶颈凸显产业痛点,“以存代算”应运而生。当前,AI推理已成为衡量大模型商业化价值的关键标尺,但在实际应用中仍面临“推不动、推得慢、推得贵”的严峻挑战。为突破算力瓶颈与“存储墙”制约,“以存代算”作为一种颠覆性技术范式应运而生。该技术通过将AI推理过程中的矢量数据(如KVCache)从昂贵的DRAM和HBM显存迁移至大容量、高性价比的SSD介质,实现存储层从内存向SSD的战略扩展,而非简单替代。其核心价值在于显著降低首Token时延、提升推理吞吐量,并大幅优化端到端的推理成本,为AI大规模落地提供可行路径。
“以存代算”核心技术:“以存代算”CachedAttention技术是一种通过将AI推理中历史对话的KVCache缓存到HBM+DRAM+SSD等外部存储介质。在该系统中,HBM作为GPU本地高速存储,负责存储当前活跃会话的KVCache,支撑LLM推理计算;DRAM作为中间缓存层,承接HBM的异步写入与SSD的预加载,平衡速度与容量;SSD则作为长期存储层,提供大容量持久化存储,承载非活跃历史数据。“以存代算”CachedAttent
加载中...
本文档仅能预览20页