文件列表:
国信证券:人工智能行业周报(25年第6周):国产大模型百花齐放,追赶全球领先水平.pdf |
下载文档 |
资源简介
>
核心观点
人工智能动态:1)产品应用:DeepSeek的多模态AI模型在处理文本和图像方面表现出色,其Janus-Pro-7B模型在GenEval基准测试中超越了DALL-E3;阿里云宣布接入DeepSeek-R1等热门模型,并推出Qwen2.5-Max,该模型在多项公开主流模型评测基准上超越了全球领先的开源MoE模型DeepSeekV3以及最大的开源稠密模型Llama-3.1-405B;月之暗面发布了新一代多模态思考模型K1.5,该模型在数学、代码、多模态推理能力等方面都接近OpenAI满血版o1;Meta发布《前沿人工智能框架》政策文件,明确对两类高风险AI系统采取限制措施;谷歌宣布全面推出Gemini2.0系列模型,涵盖Gemini2.0Flash和Gemini2.0Pro等;OpenAI的o3-mini模型在数学代码、物理模拟等基准测试中成绩优异,远超DeepSeekR1。
2)底层技术:Deepseek通过创新的训练框架及算法优化,显著降低其开发成本,其开发成本仅为600万美元,相比OpenAI的o1模型节省超过98%的成本。
3)行业政策:2025全球开发者先锋大会将于2月
加载中...
已阅读到文档的结尾了