×
img

北京大学:2025年DeepSeek-R1/Kimi 1.5及类强推理模型开发解读报告

发布者:wx****b1
2025-02-28
9 MB 76 页
人工智能(AI) 北京大学
文件列表:
北京大学:2025年DeepSeek-R1/Kimi 1.5及类强推理模型开发解读报告.pdf
下载文档

报告深入剖析了DeepSeek-R1系列及其相关强推理模型从研发历程、核心技术创新至未来展望的全方位信息。聚焦于强化学习(RL)在大语言模型推理领域的运用,报告详细探讨了DeepSeek-R1 Zero与DeepSeek-R1如何在不依赖监督微调(SFT)的前提下,采用纯粹的强化学习策略,实现推理能力的突破性提升。


加载中...

本文档仅能预览20页

继续阅读请下载文档

网友评论>