文件列表:
中泰证券:计算机:OpenAI发布多模态GPT-4,再次拓宽大模型能力边界.pdf |
下载文档 |
资源简介
>
投资事件:2023年3月14日,OpenAI发布大型多模态Transformer模型GPT-4。模型支持图片和文字输入,在视觉和文本结合的任务中展现了强大的理解力;模型在学术和职业能力相关测试中表现优异,在SAT的阅读理解考试中超越了93%的人类考生;GPT-4项目开发了深度学习Stack用于预测模型表现,能够用千分之一到万分之一的训练算力给出模型表现的准确预测结果。GPT-4支持图像和文本的共同提示输入,拥有强大的视觉理解能力。GPT-4的视觉输入模式能够支持用户指定视觉或语言任务,可以对给出的图表和问题进行推理和解答,可以快速浏览图片格式的论文并给出概括,也可以识别梗图、漫画,甚至根据对于绘制的网页前端图片输出相应的网页代码。我们认为,这种计算机视觉的突破印证了大模型向多模态转变的必然趋势,展现了语言模型在多模态领域更强大的能力边界。未来随着人类对大模型能力的持续发掘,将能够在更多场景应用AI能力,多维赋能计算机、互联网、传媒、金融等领域,有望大幅提升生产力。GPT-4在多个学术类测试集中跑出了SOTA结果,拥有更强大的创新能力。相比前代GPT,GPT-4在多个学术类测试中表现非常
加载中...
已阅读到文档的结尾了