源达信息：DeepSeek专题研究：“低成本、高性能、强推理”三位一体，DeepSeek驱动高质量模型平价化

发布者：wx****dd

2025-02-14

3 MB 17 页

互联网

文件列表：

源达信息：DeepSeek专题研究：“低成本、高性能、强推理”三位一体，DeepSeek驱动高质量模型平价化.pdf

下载文档

资源简介

Deepseek模型密集更新，用户数将持续高速增长自2024年起，DeepSeek在AI领域迅速掘起并不断选代。2024年12月底至2025年1月底，更新尤为密集，发布了参数众多且性能提升的V3、支持思维链输出和模型训练的R1，以及深耕图像领域的视觉和多模态模型。2024年12月底到2025年1月底，全球用户数从34.7万激增至1.19亿。与ChatGPT相比，DeepSeek仅用一年多就达到ChatGPT两年的用户规模，在国内1月跃居月均活跃用户数榜首，APP下载量也大幅增长。 Deepseek具备低成本、高性能、强推理三大特点 DeepSeek-V3通过算法创新和工程优化大幅提升模型效率，从而降低成本，提高性价比。DeepSeekV3训练成本仅为557万美元，耗时不到两个月。DeepSeek通用及推理模型成本相较于OpenA等同类模型大幅下降。DeepSeek-R1在继承了V3的创新架构的基础上，在后训练阶段大规模使用了强化学习技术，自动选择有价值的数据进行标注和训练，减少数据标注量和计算资源浪费，并在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等

加载中...

已阅读到文档的结尾了

下载文档