×
img

上海证券:春节期间科技新闻汇总点评:Deepseek-R1模型震动科技圈,海外大厂财报密集发布

发布者:wx****3e
2025-02-05
368 KB 3 页
互联网 上海证券
文件列表:
上海证券:春节期间科技新闻汇总点评:Deepseek-R1模型震动科技圈,海外大厂财报密集发布.pdf
下载文档
主要观点 Deepseek-R1推理模型开源,国产AI震动全球。1月20日,DeepSeek发布了全新的开源推理大模型DeepSeek-R1,在数学、编程和推理等多个任务上达到了与OpenAIo1相当的表现水平。在API定价方面,DeepSeek展现出极强的性价比优势,其API服务对输入token收取0.55美元/百万,输出token收取2.19美元/百万,而OpenAIo1的收费分别为15美元/百万和60美元/百万,价格差距接近30倍。Deepseek颠覆了AI训练的传统范式,转而完全依赖强化学习来训练模型,避免让模型形成固定的思维定式,使模型发展出独立的推理能力。DeepSeek-R1的问世被认为是中国大语言模型崛起的一个缩影,DeepSeek的创新也可能给资本开支巨大的领先AI供应商带来严峻挑战。 OpenAI和阿里通义Qwen接棒发布多款模型。2月1日,OpenAI发布全新推理模型o3-mini,是ChatGPT首次向所有用户免费提供推理模型,被视作抵御DeepSeek模型冲击的最新举措。OpenAI称o3-mini是其最具成本效益的推理模型,复杂推理和对话能力显著提升,在科学

加载中...

已阅读到文档的结尾了

下载文档

网友评论>