×
img

上海证券:计算机行业周报:国产大模型超预期,人工智能+政策持续推进

发布者:wx****d0
2024-12-31
365 KB 3 页
互联网 上海证券
文件列表:
上海证券:计算机行业周报:国产大模型超预期,人工智能+政策持续推进.pdf
下载文档
市场回顾 过去一周(12.23-12.27)上证综指上涨0.95%,创业板指下跌0.22%,沪深300指数上涨1.36%,计算机(申万)指数下跌4.25%,跑输上证综指5.21个百分点,跑输创业板指4.04个百分点,跑输沪深300指数5.61个百分点,位列全行业第29名。 周观点 国产大模型激战正酣:豆包崛起、幻方惊艳、小米入局。12月26日,幻方量化全新系列模型DeepSeek-V3上线并同步开源。DeepSeek-V3拥有671B参数,激活参数37B,在14.8T高质量token上进行了预训练,性能匹敌GPT-4O。在多项测试中,DeepSeek-V3达到了开源SOTA,超越Llama-3.1-405B,能和GPT-4o、Claude-3.5-Sonnet等TOP模型不分伯仲。值得注意的是,DeepSeek-V3整个训练过程仅用了不到280万个GPU小时,相比之下,Llama3405B的训练时长是3080万GPU小时。DeepSeekV3通过在算法、框架和硬件方面的协同优化(DeepSeekMoE架构、FP8混合精度训练框架和DualPipe算法),使得训练成本变得非常经济。同日,

加载中...

已阅读到文档的结尾了

下载文档

网友评论>