×
img

华安证券:全球科技(计算机)行业周报:DeepSeek-V3.2-Exp发布,训练推理提效,API同步降价

发布者:wx****c3
2025-10-12
646 KB 12 页
互联网 华安证券
文件列表:
华安证券:全球科技(计算机)行业周报:DeepSeek-V3.2-Exp发布,训练推理提效,API同步降价.pdf
下载文档
主要观点: 9月29日DeepSeek-V3.2-Exp正式发布,DSA实现训练推理提效DeepSeek-V3.2-Exp模型是一个实验性版本,在V3.1-Terminus的基础上引入了DeepSeekSpareAttention(稀疏注意力机制),针对长文本训练和推理效率进行探索性优化和验证。 技术层面:1)DeepSeekSpareAttention(DSA)首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现长文本训练和推理效率的大幅提升。根据各领域性能公开评测集结果(通用、搜索、代码、代码智能体、数学),DeepSeek-V3.2-Exp表现与V3.1-Terminus基本持平;2)开源TileLang与CUDA两种算子,TileLang由北大团队研发,专为简化高难度GPU算子开发而设计,将成为替代主流OpenAI领域特定语言Triton的有力备选,TileLang将调度空间与数据流解耦,使开发者能够直观地控制数据在硬件中的流动,根据TileLang在GitHub的说明文档,不仅支持英伟达CUDA,还已扩展支持华为昇腾等国产芯片。DeepSeek使用高级语言Ti

加载中...

已阅读到文档的结尾了

下载文档

网友评论>