华西证券：计算机行业周报：Gemini引爆多模态AI概念，数据要素景气度向上

发布者：wx****8b

2023-12-11

2 MB 30 页

互联网华西证券

文件列表：

华西证券：计算机行业周报：Gemini引爆多模态AI概念，数据要素景气度向上.pdf

下载文档

资源简介

一、Gemini引爆多模态AI概念，多模态发展加速当地时间12月6日，谷歌宣布发布其目前功能最强大的人工智能模型Gemini1.0。Gemini是基于Transformerdecoder构建的原生多模态大模型，目前有三个版本：功能最强大的GeminiUltra，适用于多任务的最佳模型GeminiPro和适用于端侧设备的GeminiNano，Pixel8Pro成为全球首款搭载GeminiNano的智能手机。GeminiUltra在MMLU（大规模多任务语言理解数据集）测试中首次超越人类专家，在32个多模态基准中取得30个SOTA，可以泛化并无缝理解、组合和操作不同类型的信息，同时识别理解文本、图像、音频、视频和代码五种信息。据财联社报道，谷歌旗下的人工智能助手Bard已添加了部分Gemini1.0模型的技术，明年年初有望完全融入。多模态技术可以提高人机交互的效率和质量，用户可以更自然、更直观地与计算机进行交互。作为多模态应用重要场景的机器人领域方面，多模态技术可以帮助机器人实现更加精确、高效、协调的动作控制，从而提高机器人的工作效率和质量。此前，谷歌大模型PaLM-E驱动的机器人可以执行

加载中...

本文档仅能预览20页

继续阅读请下载文档