文件列表:
民生证券:计算机行业事件点评:国产开源大模型持续进步,AI编程有望充分受益.pdf |
下载文档 |
资源简介
>
事件概述:根据DeepSeek官方公众号,2025年8月21日,深度求索正式发布DeepSeek-V3.1。
继续发力Agent,实现多维度升级。1)混合推理架构:单一模型可同时支持“思考模式”与“非思考模式”。2)更高思考效率:DeepSeek-V3.1-Think(思考模式版本)相比DeepSeek-R1-0528,能在更短时间内输出答案;经思维链压缩训练后,输出token数减少20%-50%,但各项任务平均表现与R1-0528持平。3)更强Agent能力:通过Post-Training优化,模型在工具使用与智能体任务中的表现大幅提升。
编程能力成为此次升级重点,相关评分较先前版本有较大提升。在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相比之前的DeepSeek系列模型有明显提高。1)在SWE-benchVerified测评中,DeepSeek-V3.1的分数为66.0分,较DeepSeek-V3-0324的45.4分和DeepSeek-R1-0528的44.6分有较大提升;2)在SWE-benchMultili
加载中...
已阅读到文档的结尾了