文件列表:
华西证券:计算机行业周报:Gemini引爆多模态AI概念,数据要素景气度向上.pdf |
下载文档 |
资源简介
>
一、Gemini引爆多模态AI概念,多模态发展加速当地时间12月6日,谷歌宣布发布其目前功能最强大的人工智能模型Gemini1.0。Gemini是基于Transformerdecoder构建的原生多模态大模型,目前有三个版本:功能最强大的GeminiUltra,适用于多任务的最佳模型GeminiPro和适用于端侧设备的GeminiNano,Pixel8Pro成为全球首款搭载GeminiNano的智能手机。GeminiUltra在MMLU(大规模多任务语言理解数据集)测试中首次超越人类专家,在32个多模态基准中取得30个SOTA,可以泛化并无缝理解、组合和操作不同类型的信息,同时识别理解文本、图像、音频、视频和代码五种信息。据财联社报道,谷歌旗下的人工智能助手Bard已添加了部分Gemini1.0模型的技术,明年年初有望完全融入。多模态技术可以提高人机交互的效率和质量,用户可以更自然、更直观地与计算机进行交互。作为多模态应用重要场景的机器人领域方面,多模态技术可以帮助机器人实现更加精确、高效、协调的动作控制,从而提高机器人的工作效率和质量。此前,谷歌大模型PaLM-E驱动的机器人可以执行
加载中...
本文档仅能预览20页