×
img

InfoQ:2025年推理模型综合测评报告

发布者:wx****d9
2025-05-29
4 MB 35 页
人工智能(AI)
文件列表:
InfoQ:2025年推理模型综合测评报告.pdf
下载文档

nfoQ 研究中心在对推理模型的训练原理、能力表现等进行深入分析后,围绕逻辑推理、数学推理、语言推理、多步推理、幻觉控制五大核心领域共计300道测试题目,对包括DeepSeek-R1、k1.5、Claude-3.7-Sonnet-Reasoning、GLM-Z1、Doubao-1.5-thinking-pro、o3、文心 X1 Turbo、Qwen3-235B-A22B在内的八款热门推理模型进行了全面评估。


加载中...

本文档仅能预览20页

继续阅读请下载文档

网友评论>