文件列表:
华福证券:电子行业定期报告:DeepSeek重构端侧AI部署可行性,AI化终端加速渗透.pdf |
下载文档 |
资源简介
>
投资要点:
DeepSeek相继发布了开源大语言模型V3和R1,凭借开源、极具成本优势、高性能已成为全球现象级模型。2024年底发布的DeepSeekV3通过算法创新和工程优化大幅提升模型效率,从而以不到OpenAIGPT-4o预算的1/10的训练成本,实现了与GPT-4o等顶尖模型相媲美的性能。在此基础上,DeepSeek进一步推出的R1模型则聚焦推理优化,基于V3架构引入纯强化学习与多阶段强化学习结合监督微调的R1模型,极大提升了模型推理能力,在性能与OpenAI的o1正式版不相上下的同时,其服务价格更进一步压缩到o1的约3%。当前,DeepSeek应用已登顶苹果中国地区和美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT,成为国内AI产业的发展的重大驱动力,并以其低成本高性能特性驱动AI应用的快速落地。
DeepSeek通过蒸馏技术重构端侧AI部署可行性,AI终端设备及产业链加速发展。第三方可以从DeepSeek-R1中蒸馏出更多版本的小参数模型并部署至各类终端产品中,原始模型的参数量达到671B,对推理硬件的要求高;而蒸馏模型有1.5B-70B六个版本,在
加载中...
已阅读到文档的结尾了