×
img

民生证券:传媒互联网行业周报:DeepSeek-V3发布,继续关注AI产业推进

发布者:wx****7d
2024-12-30
1 MB 20 页
游戏 民生证券
文件列表:
民生证券:传媒互联网行业周报:DeepSeek-V3发布,继续关注AI产业推进.pdf
下载文档
本周观点:DeepSeek-V3发布,为低成本训练的高性能大模型,建议继续关注AI产业推进。 12月26日,幻方量化宣布全新系列模型DeepSeek-V3上线并同步开源,API服务已同步更新,接口配置无需改动。据官网公众号,该模型性能对齐海外领先闭源模型,且训练成本大幅降低。1)性能来看,该模型为自研MoE模型,拥有6710亿参数,在14.8万亿token上进行预训练。生成速度相比V2.5模型实现了3倍的提升,每秒吞吐量达60token。对比海外开源闭源模型来看,DeepSeek-V3多项评测成绩追平甚至超越Qwen2.5-72B、Llama-3.1-405B、GPT-4o、Claude-3.5-Sonnet等开闭源模型。2)官方同步调整API服务价格,为每百万输入tokens0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens8元。价格仅为Claude3.5Sonnet的1/53。3)训练成本来看,DeepSeek-V3 训练总成本约557.6万美元,整体预训练仅用280万GPU小时,相比之下Llama3(450B版本)使用3080万GPU小时,后者几乎是前者的11倍。该

加载中...

已阅读到文档的结尾了

下载文档

网友评论>