文件列表:
天风证券:计算机行业点评:从长文本到低成本,重申全面看多AI应用.pdf |
下载文档 |
资源简介
>
幻方AI发布了DeepseekV2模型,在模型性能一流的同时达到极低的价格,性价比凸显
5月6日幻方发布了第二代MOE模型DeepSeek-V2。目前在大模型主流榜单中,DeepSeek-V2均表现出色,中文综合能力(AlignBench)开源模型中最强,与GPT-4-Turbo,文心4.0等闭源模型在评测中处于同一梯队,英文综合能力(MT-Bench)与最强的开源模型LLaMA3-70B同处第一梯队,超过最强MoE开源模型Mixtral8x22B,知识、数学、推理、编程等榜单结果也位居前列。同时,DeepSeek-V2API的定价处于极低的价格:32K上下文每百万tokens输入1元、输出2元,价格仅为GPT-4-Turbo的近百分之一,仅为同属于MoE架构的abab-6.5s模型的1/5,就中文能力来看,DeepSeek-V2在全球模型中处于第一档的位置,但其成本却是最低。
双重架构创新驱动极低训练与推理成本大幅降低
Deepseek-V2模型在模型架构上进行了全方位的创新,使用MLA(Multi-headLatentAttention)和DeepSeekMoE优化了Transfo
加载中...
已阅读到文档的结尾了