×
img

华安证券:计算机行业点评:Gemini发布,原生多模态与更强的理解能力

发布者:wx****bd
2023-12-08
348 KB 2 页
互联网 华安证券
文件列表:
华安证券:计算机行业点评:Gemini发布,原生多模态与更强的理解能力.pdf
下载文档
主要观点:事件概况谷歌于12月6日发布了其新一代AI大模型Gemini,主要特性包括但不限于:1)在基准测试中多项得分高于GPT-4V,并在视频、音频等项目中优势较大;2)原生多模态,并拥有更强的复杂推理能力;3)更细的产品分级,覆盖从云到端;4)人机协同编程成为现实;5)不同于英伟达产品的专用硬件支持。更细的产品定位划分,有望快速适配终端根据参数量和模型复杂度,Gemini将分为Ultra、Pro和Nano三个子系列,覆盖从数据中心到手持智能终端。在谷歌服务框架的普及率和完善度的加持下,Gemini有望快速投入终端市场。GeminiPro的微调版本将用于Bard进行更高级的推理、计划、理解等。Pixel8Pro是首款专为GeminiNano设计的智能手机,可在录音机中的“汇总”和Gboard中的“智能回复”等功能中使用。颠覆性的多模态训练方式不同于现有主流大模型的训练方式,即通过为不同的模态训练单独的组件,然后将它们拼接在一起以粗略地模仿其中的一些功能,Gemini从一开始就对不同的模态进行预训练,再用额外的多模态数据对其进行了微调,以进一步完善其有效性,这能帮助Gemini从头开始

加载中...

已阅读到文档的结尾了

下载文档

网友评论>