×
img

东兴证券:人工智能动态跟踪:计算机行业:DeepSeek提振国产大模型信心,有望促进AI行业发展

发布者:wx****d1
2025-02-06
561 KB 5 页
SaaS 东兴证券
文件列表:
东兴证券:人工智能动态跟踪:计算机行业:DeepSeek提振国产大模型信心,有望促进AI行业发展.pdf
下载文档
事件: (1)2024年12月底,DeepSeek-V3正式发布,DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练; (2)2025年1月底,DeepSeek-R1发布,性能对标OpenAIo1正式版。 点评: 算法+工程创新提升DeepSeek-V3模型效率,后训练阶段使用强化学习技术增强R1推理能力。(1)模型表现优异,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲;DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版;(2)推理效率提升,通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从20TPS提高至60TPS,相比V2.5模型实现了3倍的提升,使用体验更加流畅;(3)成本大幅降低,DeepSeek-V3和R1在web端和APP端可免费试用,

加载中...

已阅读到文档的结尾了

下载文档

网友评论>