×
img

华安证券:DeepSeek行业点评1:加速AI端侧落地,看好端侧SoC、存储和苹果链

发布者:wx****87
2025-02-06
233 KB 2 页
半导体 华安证券
文件列表:
华安证券:DeepSeek行业点评1:加速AI端侧落地,看好端侧SoC、存储和苹果链.pdf
下载文档
Deepseek在发布R1模型后,再次发布多模态模型 幻方量化旗下AI公司深度求索(DeepSeek)于1月20日正式发布DeepSeek-R1模型,并同步开源模型权重。据官方介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。 DeepSeek称,DeepSeek-R1蒸馏小模型超越OpenAIo1-mini。DeepSeek在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,通过DeepSeek-R1的输出,蒸馏了6个小模型开源给社区,其中32B和70B模型在多项能力上实现了对标OpenAIo1-mini的效果。 1月28日凌晨DeepSeek又开源了其多模态模型Janus-Pro-7B,宣布在在GenEval和DPG-Bench基准测试中击败了DALL-E3(来自OpenAI)和StableDiffusion。Janus-Pro-7B和Janus-Pro-1B(1.5B参数量)从命名上就能看出,模型本身来自之前Ja

加载中...

已阅读到文档的结尾了

下载文档

网友评论>