×
img

上海证券:计算机行业周报:AI大模型持续更新,算力需求维持高景气

发布者:wx****9b
2025-04-01
381 KB 3 页
互联网 上海证券
文件列表:
上海证券:计算机行业周报:AI大模型持续更新,算力需求维持高景气.pdf
下载文档
市场回顾 过去一周(3.24-3.28)上证综指下跌0.40%,创业板指下跌1.12%,沪深300指数上涨0.01%,计算机(申万)指数下跌4.89%,跑输上证综指4.49个百分点,跑输创业板指3.77个百分点,跑输沪深300指数4.90个百分点,位列全行业第31名。 周观点 AI大模型持续更新。(1)DeepSeek:3月24日,DeepSeek发布DeepSeekV3-0324模型,模型延续了V3系列的核心架构,即基于混合专家(MoE)模型设计。据悉,该模型拥有6710亿个总参数,每次推理激活其中的370亿参数,兼顾了计算效率与输出质量。此外,V3系列引入的多token预测(MTP)和无辅助损失负载均衡策略可能也在新版本中得到了进一步优化。主要更新亮点包括编码能力接近甚至部分超越了Claude3.5的水平,数学推理、创造性输出性能提升;用户体验优化更简洁高效;延续开源传统,采用了更宽松的MIT许可证;输出风格微调,输出语气更偏向技术化和正式化。(2)谷歌:3月25日,谷歌发布Gemini2.5Pro,延续前代模型的多模态能力和长上下文窗口特性,目前支持100万token的上下文窗口

加载中...

已阅读到文档的结尾了

下载文档

网友评论>