腾讯云:2025年DeepSeek消费电子行业大模型新型应用最佳实践分享报告.pdf |
下载文档 |
资源简介
DeepSeek 是“深度求索” 开发的一系列人工智能模型。DeepSeek 通过持续的技术创新 和市场拓展,在自然语言处理和大型语言模型方面取得了显著进展,在国际市场上获得了 广泛认可。其中: ● DeepSeek-V3 是在14.8万亿高质量 token 上完成预训练的一个强大的混合专家 (MoE) 语言模型,拥有6710亿参数(激活参数370亿)。作为通用大语言模型,其在在知识类任 务(知识问答、内容生成等)领域表现出色。 ● DeepSeek-R1 是基于 DeepSeek-V3-Base 训练生成的强化推理能力模型,在数学、代 码生成和逻辑推断等复杂推理任务上表现优异
本文档仅能预览20页