文件列表:
国金证券:计算机行业周报:Qwen赶超Llama成为全球第一开源模型,DeepSeek发布数学推理模型.pdf |
下载文档 |
资源简介
>
本周观点
4月29日,阿里Qwen3系列模型开源发布,包含两款MoE模型(235B/20B)以及六款密集模型(0.6B/1.7B/4B/8B/14B/32B),其中旗舰模型Qwen3-235B-A22B与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型表现相当。Qwen3的部署成本还大幅下降,仅需4张H20即可部署满血版,显存占用仅为性能相近模型的三分之一。阿里通义已开源了200余个模型,全球下载量超3亿次,Qwen衍生模型数超10万个,已超越Llama,成为全球最大的开源模型族群。本周,DeepSeek-Prover-V2发布,是一款专为「数学AI编程语言」Lean4打造的开源大语言模型,专注于形式化定理证明,参数规模微7B/671B,它能够将非形式化和形式化的数学推理融合到一个统一的模型中。从商业模式的角度来看,互联网大厂能够凭借基座模型和算力优势,通过MaaS嵌入既有应用或云平台,更容易实现规模化变现;垂类企业(如医疗、金融、企业服务等)拥有更丰富的客户资源和行业know-how,有望深耕场景化Agent。
短期来看,特朗普关税政
加载中...
已阅读到文档的结尾了