文件列表:
华西证券:计算机行业:ChatGPT,深度拆解AI算力模型.pdf |
下载文档 |
资源简介
>
ChatGPT算法的核心壁垒(1)庞大的数据训练数据,往往意味着模型精准度的上升;数据量大,往往意味着数据特征维度大,模型的参数越复杂,训练数据维度跟算力指数呈现正相关,算力成本高。(2)底层算法Transformer,相较于传统神经网络综合特征提取能力、远距离特征捕获能力、语义特征提取能力,全部明显增强,正逐步取代RNN(循环神经网络)。(3)AI预训练模型(大模型),本质是“大算力+强算法”结合的产物,对自然语言理解能力明显上升,谷歌BERT模型就是典型跨时代的例子,我们认为其是AIGC的初始应用算法。(4)多模态数据协同,极大推动AIGC的内容多样性与通用性,让AIGC不只局限于文本和图像等单个部分,而是多应用相容。不同类别AIGC算法比对1、ChatGPT:训练模型为强化学习近端策略优化,可以理解成在“人脑思维”的基础上加入了“人类反馈系统”,是一种奖励模型,拥有175B参数,训练数据为语言文本。2、LaDMA(谷歌Bard):参数方面为137B,奖励模型是人类评分机制,训练数据为对话数据。3、图神经网络(GNN)作为科学领域预训练模型(大模型)备受瞩目,强大之处在于数据结构,
加载中...
已阅读到文档的结尾了