文件列表:
华鑫证券:计算机行业周报:创数学推理新高,阿里通.pdf |
下载文档 |
资源简介
>
投资要点
算力:算力租赁价格平稳,DeepSeek-Prover-V2创数学推理新高
4月30日,DeepSeek发布名为DeepSeek-Prover-V2的数学推理模型,提供7B和671B两种参数规模。在多个标准基准测试中,DeepSeek-Prover-V2-671B都取得了神经定理证明领域的最先进性能水平。并且,面对从著名的AIME竞赛(2024-2025年)中挑选的15个问题,该模型成功解出了其中的6个。
DeepSeek-Prover-V2通过两阶段训练流程开发,建立了两种互补的证明生成模式:(1)高效非思维链(non-CoT)模式:此模式针对快速生成形式化Lean证明代码进行了优化,专注于在不显示中间推理步骤的情况下生成简洁的证明。(2)高精度思维链(CoT)模式:此模式在构建最终形式化证明之前,系统地阐述中间推理步骤,强调透明度和逻辑进展。
与DeepSeek-Prover-V1.5一致,DeepSeek-Prover-V2的两种生成模式由两个不同的引导提示控制。在第一阶段,DeepSeek团队在课程学习框架内使用专家迭代范式来训练非思维链证明模型,同时通过基于子目标的
加载中...
已阅读到文档的结尾了