×
img

华安证券:互联网:DeepSeek成本和性能双突破,有望加速国内AI进程

发布者:wx****7a
2025-02-05
400 KB 3 页
影视 华安证券
文件列表:
华安证券:互联网:DeepSeek成本和性能双突破,有望加速国内AI进程.pdf
下载文档
主要观点: DeepSeek取得AI模型性能和成本的双重突破 公司发布并开源了其最新的AI模型DeepSeek-R1。该模型在多个基准测试中表现出色,特别是在数学推理和编程任务上,达到了与OpenAI的o1模型相当的性能水平。例如,在AIME2024数学基准测试中,DeepSeek-R1的得分率为79.8%,略高于o1的79.2%;在MATH-500基准测试中,DeepSeek-R1的得分率为97.3%,也优于o1的96.4%。此外,DeepSeek发布了多模态开源模型Janus-Pro,在GenEval和DPG-Bench基准测试中,击败了StableDiffusion和OpenAI的DALL-E3;而阿里巴巴发布了Qwen2.5-Max,为超大规模MoE架构;OpenAI跟进,依次发布了全新的推理模型o3-mini,为其推理模型首次免费,并在ChatGPT上线DeepResearch,可在数十分钟完成人类专家需要几个小时的复杂研究任务。 DeepSeek主要通过训练流程设计和新算法应用取得创新 12月发布的DeepSeek-V3主要体现了高效架构与创新技术的结合,包括1)MoE架构

加载中...

已阅读到文档的结尾了

下载文档

网友评论>

开通智库会员享超值特权
专享文档
免费下载
免广告
更多特权
立即开通

发布机构

更多>>