文件列表:
上海证券:互联网传媒行业周观点:周观点:“调用”快速适配垂类场景,“再训练”构筑垂类大模型.pdf |
下载文档 |
资源简介
>
主要观点我们理解“通用大模型”+“行业小样本”是AI大模型快速适配垂类场景的通用架构,进一步拆解可分层为“能力调用”及“能力训练”两层:1、“能力调用”是指下游垂类场景直接调用通用大模型的通用能力,并基于垂类场景内产生的特性化数据不断提升调用能力在垂类场景内的适配程度。我们认为现阶段下游应用及内容主要采取此类方式接入大模型能力,此类方式可高效快速调用大模型先进能力,在时间上及成本上具备优势。2、“能力训练”是指下游垂类场景将通用大模型针对特性化数据集进行再训练,从而形成垂类场景专属大模型。例如彭博社利用自身丰富的金融数据源,基于开源的GPT-3框架再训练,开发出了金融专属大模型BloombergGPT。我们认为未来拥有丰富特性化数据集的下游垂类场景将主要采取此类方式,有助于构筑更强的能力壁垒。我们理解AI大模型是一种新型平台模式,是移动互联网向沉浸互联网发展的中间形态。从平台的逻辑出发,AI产业链包括上层大模型、中层小模型、下层应用及内容,包括应用及内容直接接入大模型或通过小模型接入大模型两种方式。基于我们对大模型适配垂类场景的理解,拥有丰富特性化数据集的垂类场景将更能高效利用AI大模
加载中...
已阅读到文档的结尾了