文件列表:
国都证券:计算机周报:Deepseek日活数持续突破,国产AI产业链有望形成闭环.pdf |
下载文档 |
资源简介
>
核心观点
一、摘要:
Deepseek通过算法结构的优化,实现了AI模型的大幅降本增效,同时通过蒸馏技术,成功地将自身知识迁移到了更小的模型中。其中,32B和70B版本的性能超越了GPT-4o、Claude3.5Sonnet,接近o1-mini。同时,1.5B参数模型性能与GPT4o相当,适用于资源有限的设备(如PC或手机),极大降低了AI技术的使用门槛。此外,据QuestMobile数据显示,DeepSeek在1月28日的日活跃用户数首次超越豆包,随后在2月1日突破3000万大关,成为史上最快达成这一里程碑的应用。目前国内主流云平台,如百度智能云、华为云、腾讯云、火山引擎、天翼云等,均陆续上线了相关模型,支持公有云在线部署、专混私有化实例部署等模式,希望吸引更多客户使用其算力和服务。此外,多家国产芯片厂商也都在纷纷响应,华为、摩尔线程、海光信息于近期宣布了适配支持。当前主流国产芯片已基本实现对DeepSeek蒸馏版小模型的兼容支持。这意味着任何能够运行Llama、Qwen等常见开源模型的设备,现可无缝运行DeepSeek的蒸馏版小模型。随着国产AI模型性能提升,尤其是蒸馏后的小模型性
加载中...
已阅读到文档的结尾了