文件列表:
甬兴证券:电子:DeepSeek有望推动AI应用加速落地,AI端侧与国产算力需求或迎提速.pdf |
下载文档 |
资源简介
>
事件描述
根据科创板日报报道,2024年12月26日,幻方量化宣布,全新系列模型DeepSeek-V3上线并同步开源,API服务已同步更新,接口配置无需改动。
核心观点
幻方量化旗下DeepSeek上线V3版本,成本低性能优秀。DeepSeek-V3为自研MoE模型,生成速度相比V2.5模型实现了3倍的提升,但暂不支持多模态输入输出。在参数和性能方面,DeepSeek-V3拥有6710亿参数,其中激活参数为370亿,在14.8万亿token上进行了预训练。在生成速度方面,相比V2.5版本,DeepSeek-V3的生成速度提升至3倍,每秒吞吐量高达60token。在开源和可用性方面,DeepSeek-V3完全开源。在多项基准测试中,DeepSeek-V3的成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。幻方量化在已开源的论文中强调其训练成本极低,通过对算法、框架和硬件的优化协同设计,DeepSeek-V3的全部训练成本总计仅为557.6万美元;DeepSeek-V3的A
加载中...
已阅读到文档的结尾了