文件列表:
国金证券:通信行业研究:DeepSeek-R1-0528发布,国产大模型能力持续优化.pdf |
下载文档 |
资源简介
>
1)DeepSeek-R1-0528发布,推理能力增强、幻觉率降低。DeepSeek-R1-0528仍然采用DeepSeekV3Base模型作为基座,模型参数为685B,开源版本可支持128K上下文总长度。在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%,主要得益于模型在推理过程中的思维深度增强:新版模型平均每题使用23Ktokens,约为旧版的两倍。此外,与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了约45-50%。我们认为,国产大模型能力的持续优化将加速AI推理需求增长,利好国产算力芯片及AI服务器厂商。2)英伟达发布1Q25财报,Blackwell整体表现强劲,预计贡献数据中心收入的70%,并已登陆AWS、谷歌云等四大云平台。GB200散热难题得到攻克,并已于1Q25出货;GB300将于3Q25出货。我们看好英伟达服务器组装厂、高速光模块厂商、液冷供应商迎来业绩放量。同时,受到美国出口管制影响,英伟达针对中国市场的H20芯片计提了45亿美元库存减值(低于市场预期的55亿美元),同时导致80亿美元的Q2收入缺口。我们认为Hoppe
加载中...
已阅读到文档的结尾了