×
img

华鑫证券:计算机行业周报:DeepSeekR1-0528升级,字节扣子空间上线一键转播客功能

发布者:wx****d4
2025-06-06
1 MB 15 页
互联网 华鑫证券
文件列表:
华鑫证券:计算机行业周报:DeepSeekR1-0528升级,字节扣子空间上线一键转播客功能.pdf
下载文档
投资要点 0528升级 5月29日,DeepSeek正式官宣R1已完成小版本升级,开启「深度思考」功能即可体验。在多项基准测试中,DeepSeek-R1-0528的数学、编程、通用逻辑性能,足以媲美o3和Gemini2.5Pro。 除性能刷新SOTA,此次R1的更新还在其他三方面有所体现:前端代码生成能力增强;幻觉率降低45%-50%;支持JSON输出和函数调用。不仅如此,DeepSeek官方基于Qwen3-8BBase微调出更强版本——DeepSeek-R1-0528-Qwen3-8B。该80亿参数模型在AIME2024测评中表现优异,性能仅次于DeepSeek-R1-0528本体,甚至可与Qwen3-235B-thinking大模型竞争。 首先,DeepSeek-R1-0528数学编程能力增强:在后训练阶段,R1投入了更多计算资源,并引入了算法优化机制,显著提升了模型的思维深度与推理能力。在AIME测试集中,DeepSeek-R1平均每个问题消耗12Ktoken,而DeepSeek-R1-0528平均每个问题使用23Ktoken。在外部多语言Aider基准测试,结果显示,DeepS

加载中...

已阅读到文档的结尾了

下载文档

网友评论>