天风证券：计算机行业点评：从长文本到低成本，重申全面看多AI应用

发布者：wx****ff

2024-05-13

1 MB 5 页

互联网天风证券

文件列表：

天风证券：计算机行业点评：从长文本到低成本，重申全面看多AI应用.pdf

下载文档

资源简介

幻方AI发布了DeepseekV2模型，在模型性能一流的同时达到极低的价格，性价比凸显 5月6日幻方发布了第二代MOE模型DeepSeek-V2。目前在大模型主流榜单中，DeepSeek-V2均表现出色，中文综合能力（AlignBench）开源模型中最强，与GPT-4-Turbo，文心4.0等闭源模型在评测中处于同一梯队，英文综合能力（MT-Bench）与最强的开源模型LLaMA3-70B同处第一梯队，超过最强MoE开源模型Mixtral8x22B，知识、数学、推理、编程等榜单结果也位居前列。同时，DeepSeek-V2API的定价处于极低的价格：32K上下文每百万tokens输入1元、输出2元，价格仅为GPT-4-Turbo的近百分之一，仅为同属于MoE架构的abab-6.5s模型的1/5，就中文能力来看，DeepSeek-V2在全球模型中处于第一档的位置，但其成本却是最低。双重架构创新驱动极低训练与推理成本大幅降低 Deepseek-V2模型在模型架构上进行了全方位的创新，使用MLA（Multi-headLatentAttention）和DeepSeekMoE优化了Transfo

加载中...

已阅读到文档的结尾了

下载文档