×
img

华鑫证券:计算机行业周报:智谱AI发布GLM-4.5V多模态模型,昆仑万维发布业界首个多模态深度调研Agent

发布者:wx****50
2025-08-18
1 MB 16 页
互联网 华鑫证券
文件列表:
华鑫证券:计算机行业周报:智谱AI发布GLM-4.5V多模态模型,昆仑万维发布业界首个多模态深度调研Agent.pdf
下载文档
投资要点 算力:算力租赁价格平稳,智谱AI发布GLM-4.5V多模态模型 8月11日,智谱AI正式发布开源视觉推理模型GLM-4.5V,该模型凭借1060亿总参数和120亿激活参数的规模,在41项多模态基准测试中刷新同级别开源模型的性能纪录。基于GLM-4.5-Air文本基座模型构建,GLM-4.5V采用视觉编码器、MLP适配器和语言解码器的三部分架构,并引入三维旋转位置编码(3D-RoPE)技术,显著提升了对空间关系的感知能力。其训练采用预训练、监督微调和强化学习三阶段策略,结合思维链样本和多领域奖励系统,在STEM问题、多模态定位等任务中表现卓越。应用方面,GLM-4.5V不仅能实现精准视觉定位和复杂文档解析,还具备前端复刻和GUI智能体交互能力,这一突破性成果为安全监测、远程遥感等领域提供了高性能多模态解决方案。 AI应用:QuillBot周访问量环比+4.44%,昆仑万维发布业界首个多模态深度调研Agent 8月14日,昆仑万维重磅发布业界首个「多模态深度调研」Agent,可通过创新性地整合多模态检索理解和跨模态生成能力,它不仅能够识别并处理图片、图表等信息,还能将图片中的关键

加载中...

已阅读到文档的结尾了

下载文档

网友评论>