文件列表:
华鑫证券:计算机行业周报:DeepSeekR1-0528升级,字节扣子空间上线一键转播客功能.pdf |
下载文档 |
资源简介
>
投资要点
0528升级
5月29日,DeepSeek正式官宣R1已完成小版本升级,开启「深度思考」功能即可体验。在多项基准测试中,DeepSeek-R1-0528的数学、编程、通用逻辑性能,足以媲美o3和Gemini2.5Pro。
除性能刷新SOTA,此次R1的更新还在其他三方面有所体现:前端代码生成能力增强;幻觉率降低45%-50%;支持JSON输出和函数调用。不仅如此,DeepSeek官方基于Qwen3-8BBase微调出更强版本——DeepSeek-R1-0528-Qwen3-8B。该80亿参数模型在AIME2024测评中表现优异,性能仅次于DeepSeek-R1-0528本体,甚至可与Qwen3-235B-thinking大模型竞争。
首先,DeepSeek-R1-0528数学编程能力增强:在后训练阶段,R1投入了更多计算资源,并引入了算法优化机制,显著提升了模型的思维深度与推理能力。在AIME测试集中,DeepSeek-R1平均每个问题消耗12Ktoken,而DeepSeek-R1-0528平均每个问题使用23Ktoken。在外部多语言Aider基准测试,结果显示,DeepS
加载中...
已阅读到文档的结尾了