×
img

上海证券:AIGC系列专题:“大模型+小样本”快速适配下游场景,“AI+传媒”的效力取决于适配与迭代——通用预训练模型技术拆解

发布者:wx****20
2023-03-30
1 MB 11 页
影视 上海证券
文件列表:
上海证券:AIGC系列专题:“大模型+小样本”快速适配下游场景,“AI+传媒”的效力取决于适配与迭代——通用预训练模型技术拆解.pdf
下载文档
主要观点我们拆解ChatGPT技术模型后认为,GPT与应用层的结合属于“通用大模型+行业小样本”的技术范式,通过上游通用预训练语言模型及下游任务知识迁移实现通用大模型与垂直应用的快速适配,形成独立且差异化的应用专属大模型。其中预训练大模型的构建可以将更多的资源和数据转移到上游,小样本学习可以提升模型迭代的速度并快速适配下游场景。我们认为“AI+传媒”在应用层表现效力优劣的关键取决于通用大模型对垂直应用的适配程度及迭代速度。适配程度是指:多模态的输入及输出是否匹配应用层的输入及输出。比如GPT-4属于“图+文”多模态输入+“文”单模态输出,因此输入模态为“图或文”且输出模态为“文”的垂直应用更适配GPT-4。迭代速度是指:应用层产生的“行业小样本”的数据量是否匹配大模型的迭代要求。根据我们对GPT模型的理解,比如BingAI产生的“行业小样本”源自Bing的搜索结果,ChatGPT产生的“行业小样本”源自用户的反馈和互动。因此我们认为,对于超出GPT所使用的预训练数据库范围(2021年9月前)的事实性表述,BingAI反馈的是搜索的结果,ChatGPT反馈的是用户主动的观点,BingAI

加载中...

已阅读到文档的结尾了

下载文档

网友评论>