文件列表:
上海证券:计算机行业周报:国产大模型进步显著,北美云巨头capex预期乐观.pdf |
下载文档 |
资源简介
>
市场回顾
过去一周(5.6-5.10)上证综指上涨1.60%,创业板指上涨1.06%,沪深300指数上涨1.72%,计算机(申万)指数下跌3.24%,跑输上证综指4.84pcts,跑输创业板指4.30pcts,跑输沪深300指数4.95pcts,位列全行业第31名。
周观点
国产大模型进步显著,开始卷价格。(1)DeepSeek:5月6日,幻方旗下DeepSeek发布开源MoE模型DeepSeek-V2,中文综合能力开源模型中最强,与GPT-4-Turbo、文心4.0等闭源模型在评测中处于同一梯队;英文综合能力与最强的开源模型LLaMA3-70B同处第一梯队,超过最强MoE开源模型Mixtral8x22B;知识、数学、推理、编程等榜单结果也位居前列,并支持128K上下文窗口。DeepSeek-V2API的定价为每百万tokens输入1元、输出2元(32K上下文),价格仅为GPT-4-Turbo的近百分之一,性价比极高。模型通过使用MLA(Multi-headLatentAttention)架构,大幅减少计算量和推理显存,自研Sparse结构DeepSeekMoE则进一步将计算量降低到极
加载中...
已阅读到文档的结尾了