文件列表:
上海证券:计算机行业周报:大模型、应用百花齐放,算力军备竞赛如火如荼.pdf |
下载文档 |
资源简介
>
市场回顾
过去一周(1.20-1.24)上证综指上涨0.33%,创业板指上涨2.64%,沪深300指数上涨0.54%,计算机(申万)指数上涨3.95%,跑赢上证综指3.62个百分点,跑赢创业板指1.31个百分点,跑赢沪深300指数3.42个百分点,位列全行业第2名。
周观点
国内大模型创新持续推进,追赶美国先进水平。(1)DeepSeek:1月20日,DeepSeek发布推理模型DeepSeek-R1正式版,同步开源模型权重,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。价格方面,DeepSeek-R1API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元,输出API价格只有OpenAIo1的3%。(2)MiniMax:近日,MiniMax发布并开源了新一代01系列人工智能模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型Min
加载中...
已阅读到文档的结尾了