文件列表:
上海证券:计算机行业周报:AI大模型持续迭代,算力资本开支持续加码.pdf |
下载文档 |
资源简介
>
市场回顾
过去一周(4.28-5.2)上证综指下跌0.49%,创业板指上涨0.04%,沪深300指数下跌0.43%,计算机(申万)指数上涨2.47%,跑赢上证综指2.95个百分点,跑赢创业板指2.42个百分点,跑赢沪深300指数2.90个百分点,位列全行业第2名。
周观点
AI大模型仍在持续更新。(1)阿里巴巴:4月29日,阿里巴巴发布Qwen3系列模型,包含两款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等六款密集模型。旗舰型号Qwen3-235B-A22B参数量仅为DeepSeek-R1的三分之一,做到了在成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,成为全球最强开源模型。据悉,仅需4张H20即可部署Qwen3满血版,显存占用仅为性能相近模型的三分之一。Qwen3是国内首个“混合推理模型”,即将“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,这样能大大节省算力消耗。(2)DeepSeek:4月30日,DeepSeek在AI开源社区HuggingFace上发布了DeepSe
加载中...
已阅读到文档的结尾了