平安证券：AI动态跟踪系列（四）：DeepSeek引发广泛关注，大模型应用落地将加速

发布者：wx****68

2025-02-06

2 MB 16 页

互联网平安证券

文件列表：

平安证券：AI动态跟踪系列（四）：DeepSeek引发广泛关注，大模型应用落地将加速.pdf

下载文档

资源简介

平安观点： DeepSeek-V3和DeepSeek-R1陆续发布，国产大模型能力已可比肩海外领军大模型。2024年12月26日，杭州AI公司深度求索（DeepSeek）正式发布DeepSeek-V3大模型首个版本并同步开源。根据DeepSeek网站信息，DeepSeek-V3为自研MoE模型，671B参数，激活37B，在14.8Ttokens上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet相当。在训练成本方面，根据DeepSeek发布的技术文档论文信息，DeepSeek-V3的训练时长为2788K个H800GPU小时，训练花费约为557.6万美元。2025年1月20日，DeepSeek正式发布复杂推理类大模型DeepSeek-R1，性能对齐OpenAIo1正式版。以DeepSeek系列大模型为代表的国产大模型性能已可比肩海外领军大模型，且成本更低。 DeepSeek系列大模型引发全球广泛关注，海内外巨头科技公司及云服务平台厂商已相

加载中...

已阅读到文档的结尾了

下载文档