北京大学：2025年DeepSeek-R1/Kimi 1.5及类强推理模型开发解读报告

发布者：wx****b1

2025-02-28

9 MB 76 页

人工智能（AI）北京大学

文件列表：

北京大学：2025年DeepSeek-R1/Kimi 1.5及类强推理模型开发解读报告.pdf

下载文档

资源简介

报告深入剖析了DeepSeek-R1系列及其相关强推理模型从研发历程、核心技术创新至未来展望的全方位信息。聚焦于强化学习（RL）在大语言模型推理领域的运用，报告详细探讨了DeepSeek-R1 Zero与DeepSeek-R1如何在不依赖监督微调（SFT）的前提下，采用纯粹的强化学习策略，实现推理能力的突破性提升。

加载中...

本文档仅能预览20页

继续阅读请下载文档