甬兴证券：电子：DeepSeek有望推动AI应用加速落地，AI端侧与国产算力需求或迎提速

发布者：wx****2a

2025-02-10

440 KB 3 页

消费电子

文件列表：

甬兴证券：电子：DeepSeek有望推动AI应用加速落地，AI端侧与国产算力需求或迎提速.pdf

下载文档

资源简介

事件描述根据科创板日报报道，2024年12月26日，幻方量化宣布，全新系列模型DeepSeek-V3上线并同步开源，API服务已同步更新，接口配置无需改动。核心观点幻方量化旗下DeepSeek上线V3版本，成本低性能优秀。DeepSeek-V3为自研MoE模型，生成速度相比V2.5模型实现了3倍的提升，但暂不支持多模态输入输出。在参数和性能方面，DeepSeek-V3拥有6710亿参数，其中激活参数为370亿，在14.8万亿token上进行了预训练。在生成速度方面，相比V2.5版本，DeepSeek-V3的生成速度提升至3倍，每秒吞吐量高达60token。在开源和可用性方面，DeepSeek-V3完全开源。在多项基准测试中，DeepSeek-V3的成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。幻方量化在已开源的论文中强调其训练成本极低，通过对算法、框架和硬件的优化协同设计，DeepSeek-V3的全部训练成本总计仅为557.6万美元；DeepSeek-V3的A

加载中...

已阅读到文档的结尾了

下载文档