文件列表:
开源证券:传媒行业周报:模型迭代、国漫电影上新持续推进,继续布局AI、IP行业周报.pdf |
下载文档 |
资源简介
>
阿里通义、DeepSeek模型再迭代,纳米AI引领Agent突破,继续布局AI4月29日,阿里通义千问模型Qwen3正式开源,其采用MoE架构,总参数235B,是国内首个混合推理模型,在代码、数学、通用能力等基准测试中,性能超越DeepSeek-R1和OpenAIo1,在多个方面实现了增强:(1)支持两种思考模式(逐步推理的慢思考模式及快速响应的慢思考模式);(2)支持更多语言;(3)Agent能力提升,加强了对MCP的支持;在性能大幅提升的同时,Qwen3的部署成本还大幅下降,显存占用仅为性能相近模型的1/3。4月30日,DeepSeek正式发布并开源新模型DeepSeek-Prover-V2-671B,其在V3-Base基础上训练,训练过程依靠递归、专家迭代、监督微调和强化学习,数学推理能力大幅提升,在神经定理证明方面实现了当前最优的性能,MiniF2F-test上达到了88.9%的通过率。此外,MCP生态持续扩张,4月23日,三六零旗下纳米AI推出面向无技术背景个人用户的MCP万能工具箱,为国内首家开放生态MCP,目前已配置包括纳米AI自研及第三方的上百款MCP工具,覆盖办公、学
加载中...
已阅读到文档的结尾了