×
img

天风证券:通信行业研究周报:IBM发布Granite3.0企业模型;深度求索DeepSeekV3编程能力紧追o1

发布者:wx****11
2024-12-29
1 MB 12 页
电信 IBM 天风证券
文件列表:
天风证券:通信行业研究周报:IBM发布Granite3.0企业模型;深度求索DeepSeekV3编程能力紧追o1.pdf
下载文档
本周行业动态: IBM推出新一代企业AI模型Granite3.0 IBM发表了自家旗舰级模型系列第三代Granite3.0;它经由宽松的Apache2.0许可发布,在众多学术与行业评比测试中,均超越或与类似规模的竞者模型并驾齐驱,展现了优异的性能、建模弹性、透明度与安全性。 DeepSeekV3多语言编程性能优异 DeepSeek模型采用自研MoE架构,拥有671B参数,在14.8Ttoken上完成预训练。DeepSeekV3是知名私募巨头幻方量化旗下人工智能公司深度求索(DeepSeek)开源的最新版Al模型,为自研MoE模型,在多语言编程能力上的进步显著。在aider多语言编程测评中的表现超越了Claude3.5SonnetV2等竞争对手。 小米正搭建GPU万卡集群,将大力投入AI大模型 报道称小米大模型团队在成立时已有6500张GPU资源。自2016年组建AI团队以来,小米人工智能团队经过7年6次扩展,相关领域人员规模已达3000多人,其AI技术能力已覆盖视觉、声学、语音、NLP、知识图谱等方向,并逐步接入手机、汽车、AIoT、机器人等业务板块。 本周投资观点: 本周IBM推出新

加载中...

已阅读到文档的结尾了

下载文档

网友评论>