文件列表:
中邮证券:人工智能行业周报:DeepSeekV3.1提振国产算力和应用.pdf |
下载文档 |
资源简介
>
DeepSeekV3.1悄然上线,升级架构,优化能力
8月21日,深度求索正式发布并开源DeepSeek-V3.1,采用混合推理架构,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文均已扩展为128K。从性能来看:1)编程:V3.1在Aider编程基准测试中取得71.6%高分,“霸榜”开源模型、超越ClaudeOpus4,同时推理和响应速度更快;2)SVGBench:实力仅次于GPT-4.1-mini,远超前代DeepSeekR1;3)MMLU:在多任务语言理解方面,V3.1的表现毫不逊色于GPT-5,得分达到88.5%。
思维链机制压缩,更低推理成本迈向Agent时代
1)更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。
2)思考效率更高效:相同性能下输出token减少,降低推理成本。根据深度求索团队测试结果,经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。同时,V3.1在非思考模式下的输出长度也得
加载中...
已阅读到文档的结尾了