文件列表:
华安证券:互联网:DeepSeek成本和性能双突破,有望加速国内AI进程.pdf |
下载文档 |
资源简介
>
主要观点:
DeepSeek取得AI模型性能和成本的双重突破
公司发布并开源了其最新的AI模型DeepSeek-R1。该模型在多个基准测试中表现出色,特别是在数学推理和编程任务上,达到了与OpenAI的o1模型相当的性能水平。例如,在AIME2024数学基准测试中,DeepSeek-R1的得分率为79.8%,略高于o1的79.2%;在MATH-500基准测试中,DeepSeek-R1的得分率为97.3%,也优于o1的96.4%。此外,DeepSeek发布了多模态开源模型Janus-Pro,在GenEval和DPG-Bench基准测试中,击败了StableDiffusion和OpenAI的DALL-E3;而阿里巴巴发布了Qwen2.5-Max,为超大规模MoE架构;OpenAI跟进,依次发布了全新的推理模型o3-mini,为其推理模型首次免费,并在ChatGPT上线DeepResearch,可在数十分钟完成人类专家需要几个小时的复杂研究任务。
DeepSeek主要通过训练流程设计和新算法应用取得创新
12月发布的DeepSeek-V3主要体现了高效架构与创新技术的结合,包括1)MoE架构
加载中...
已阅读到文档的结尾了