×
img

华鑫证券:计算机行业周报:创数学推理新高,阿里通

发布者:wx****c2
2025-05-07
827 KB 15 页
互联网 华鑫证券
文件列表:
华鑫证券:计算机行业周报:创数学推理新高,阿里通.pdf
下载文档
投资要点 算力:算力租赁价格平稳,DeepSeek-Prover-V2创数学推理新高 4月30日,DeepSeek发布名为DeepSeek-Prover-V2的数学推理模型,提供7B和671B两种参数规模。在多个标准基准测试中,DeepSeek-Prover-V2-671B都取得了神经定理证明领域的最先进性能水平。并且,面对从著名的AIME竞赛(2024-2025年)中挑选的15个问题,该模型成功解出了其中的6个。 DeepSeek-Prover-V2通过两阶段训练流程开发,建立了两种互补的证明生成模式:(1)高效非思维链(non-CoT)模式:此模式针对快速生成形式化Lean证明代码进行了优化,专注于在不显示中间推理步骤的情况下生成简洁的证明。(2)高精度思维链(CoT)模式:此模式在构建最终形式化证明之前,系统地阐述中间推理步骤,强调透明度和逻辑进展。 与DeepSeek-Prover-V1.5一致,DeepSeek-Prover-V2的两种生成模式由两个不同的引导提示控制。在第一阶段,DeepSeek团队在课程学习框架内使用专家迭代范式来训练非思维链证明模型,同时通过基于子目标的

加载中...

已阅读到文档的结尾了

下载文档

网友评论>