文件列表:
开源证券:传媒行业周报:DeepSeek/OpenAI或加速Agent/多模态/端侧AI落地行业周报.pdf |
下载文档 |
资源简介
>
DeepSeek/阿里/OpenAI竞相发新模型,或加速Agent/多模态/端侧AI落地1月下旬以来,DeepSeek-R1引发全球AI界广泛关注和讨论,DeepSeekV3及R1或基于宽MoE架构、低精度训练、双管道训练策略及多Token预测(MTP)等优化降低了模型训练成本,并通过多头潜在注意力、动态专家选择等方式降低了推理成本,同时在post-training阶段或大规模使用了强化学习(RL)技术,从而实现优秀的模型性能。由于DeepSeekR1的低成本高性能及开源属性,或推动智能体(Agent)加快落地,1月底微软、英伟达、亚马逊分别宣布将DeepSeekR1上线自身企业服务平台。1月28日,DeepSeek又发布了多模态模型Janus-Pro一键整合包,阿里巴巴也宣布通义全新视觉理解模型Qwen2.5-VL上线并开源,视觉Agent(视觉定位、视频理解等)能力大幅增强。2月2日,OpenAI又发布了面向深度研究领域的Agent新品“DeepResearch”,由其将推出的o3模型提供支持,可利用推理来搜索、解释和分析互联网上的大量文本、图像和PDF,生成研究报告。我们认为De
加载中...
已阅读到文档的结尾了