CIC赛昇：2025年大模型智能体开发平台技术能力测试研究报告

发布者：wx****71

2025-08-13

2 MB 21 页

人工智能（AI）

文件列表：

CIC赛昇：2025年大模型智能体开发平台技术能力测试研究报告.pdf

根据报告的内容，本文主要围绕大模型智能体开发平台技术能力综合测试报告展开，包括以下关键点：

1、测试概述：报告介绍了测试背景、核心内容、方法与数据说明，以及免责声明。

2、RAG能力测试：评估了各平台在文本问答、结构化数据问答和图文问答任务中的RAG能力，包括检索精准度、知识覆盖广度等六大维度。

3、工作流能力测试：考察了各平台在参数动态提取、异常回退等工作流能力，重点关注流程控制机制。

4、Agent能力测试：评估了各平台智能体的工具调用能力，包括意图理解深度、操作协同性等四大维度。

5、总结与展望：指出各平台在基础能力上趋同，但在复杂场景处理、多模态协同和工具生态建设上存在差异，未来竞争将取决于场景适配、技术链厚度和生态广度。

6、测试指标定义：给出了文档单点知识回复准确率、多文档多段知识组合回复准确率等16个测试指标的定义。

加载中...

本文档仅能预览20页

开通智库会员享超值特权

专享文档

免费下载

免广告

更多特权