文件列表:
民生证券:传媒行业事件点评:谷歌发布Gemini,把握AI多模态应用投资机遇.pdf |
下载文档 |
资源简介
>
事件12月6日谷歌发布多模态大模型Gemini。Gemini原生地支持多模态,使用图像、音频、视频和文字等数据进行预训练,其能够无缝地理解和推理各种输入,远远优于现有多模态模型,在各种领域都具有强大的理解和推理能力。Gemini支持32k上下文长度,先发版本包括Ultra、Pro和Nano三种规格1)Ultra是最强大的规格,适用于高度复杂的任务;2)Pro具有增强性能和大规模部署能力,适用于多任务;3)Nano适用于特定任务及移动设备。Gemini多模态理解推理能力极强,测试结果或超越GPT-4Gemini具有强大的多模态信息理解推理能力,其可以同时识别和理解文本、图像、音频等,擅长解释数学和物理等复杂学科的推理。在MMLU上,GeminiUltra是第一个在57个学科上实现超过90%的人类专家水平得分的模型。据官方文档案例,1)如图2所示,Gemini能够理解学生杂乱的笔迹,理解关于滑雪者滑下斜坡的物理问题,识别出学生在解决问题时出错的具体推理步骤,并给出解决问题的正确方法。2)如图4所示,Gemini能够识别图像中显示的特定植物,并提供相关信息。尽管有错别字,Gemini仍能理解
加载中...
已阅读到文档的结尾了