×
img

平安证券:AI动态跟踪系列(四):DeepSeek引发广泛关注,大模型应用落地将加速

发布者:wx****68
2025-02-06
2 MB 16 页
互联网 平安证券
文件列表:
平安证券:AI动态跟踪系列(四):DeepSeek引发广泛关注,大模型应用落地将加速.pdf
下载文档
平安观点: DeepSeek-V3和DeepSeek-R1陆续发布,国产大模型能力已可比肩海外领军大模型。2024年12月26日,杭州AI公司深度求索(DeepSeek)正式发布DeepSeek-V3大模型首个版本并同步开源。根据DeepSeek网站信息,DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8Ttokens上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet相当。在训练成本方面,根据DeepSeek发布的技术文档论文信息,DeepSeek-V3的训练时长为2788K个H800GPU小时,训练花费约为557.6万美元。2025年1月20日,DeepSeek正式发布复杂推理类大模型DeepSeek-R1,性能对齐OpenAIo1正式版。以DeepSeek系列大模型为代表的国产大模型性能已可比肩海外领军大模型,且成本更低。 DeepSeek系列大模型引发全球广泛关注,海内外巨头科技公司及云服务平台厂商已相

加载中...

已阅读到文档的结尾了

下载文档

网友评论>