文件列表:
甬兴证券:通信行业点评报告:Deepseek发布AI模型,成本大幅降低,有望助力AI应用推广.pdf |
下载文档 |
资源简介
>
事件
据IT之家1月20日消息,幻方量化旗下AI公司深度求索(DeepSeek)正式发布DeepSeek-R1模型,并同步开源模型权重。据官方介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有少量标注数据的情况下,提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。
核心观点
DeepSeek大模型版本陆续迭代,低成本高性能优势明显。据光明网报道,2023年11月2日,DeepSeek推出首个模型DeepSeekCoder,该模型免费供商业使用且完全开源。2023年11月29日,DeepSeekLLM上线,其参数规模达到67B性能接近GPT-4,同时还发布了该模型聊天版本DeepSeekChat。2024年5月,DeepSeek-V2发布,该模型在性能上比肩GPT-4Turbo,价格却只有GPT-4的百分之一。2024年12月底DeepSeek-V3发布,其性能与GPT-4o和ClaudeSonnet3.5等顶尖模型相近,但训练成本很低。整个训练在2048块英伟达H800GPU集群上完成仅花费约557.6万美元,相比之下GPT-
加载中...
已阅读到文档的结尾了