文件列表:
华安证券:战略科技(计算机)行业周报:详解大模型训练与推理对算力产业链的需求影响.pdf |
下载文档 |
资源简介
>
类chatGPT大模型带来的算力增长,毋庸置疑。但算力的需求,不止局限于模型的投资初期。随着GPTAPI的开放、下游应用多模态的成熟,对于的大模型的推理算力需求进一步提升。也即,在模型不断更迭训练中,算力需求提升;在模型应用推理中,算力需求进一步提升。由此,整个算力需求一如互联网时期的流量需求,持续爆发。整个大模型的算力需求包括训练端与推理端。本文计算的不是金额,而是潜在的对于以英伟达GPU为代表的芯片需求。由此对应,产业链需求。训练端算力需求,与模型参数、训练数据集规模正相关在训练端,算力的需求=2×#ofconnections×3×#oftrainingexamples×#ofepochs。(资料来源:EstimatingTrainingComputeofDeepLearningModels(epochai.org))其中:#ofconnections,是指神经网络中,相互依赖的神经元数量。举例在一个完全链接的神经网络中,N层输入与M层输出,则#ofconnections=N*M。通常parameters可以近似于#ofconnections。#oftrainingexamples
加载中...
已阅读到文档的结尾了