海通国际：中国电子：推理力跃升10倍，理论性能对标GPT-5与Claude4Opus

发布者：wx****de

2025-07-11

1 MB 10 页

半导体

文件列表：

海通国际：中国电子：推理力跃升10倍，理论性能对标GPT-5与Claude4Opus.pdf

下载文档

资源简介

事件： 2025年7月9日，xAI正式发布其最新旗舰大模型Grok4，并于北京时间7月10日上午11点举行全球直播发布会。该模型在xAI自研的Colossus超级计算机上训练，跳过3.5版本，直接命名为Grok4。相较前代，Grok4在推理性能、多模态能力和上下文处理能力上均实现跃升。Grok4现已开放API访问，月费定价为30美元，重载多智能体版本Grok4Heavy定价300美元；未来将于8月推出编程模型、9月上线多模态智能体版本，并于10月支持视频生成模型。点评：训练强度大幅跃升，工具融合显著提升智能边界。Grok4的训练规模远超前代模型，计算资源投入为Grok-2的100倍、Grok-3的10倍，核心依托xAI自建的20万张GPU超算集群。训练过程中广泛引入RL技术，特别是在“人类最后考试”（HLE）基准中，工具融入训练显著提升了模型在复杂推理任务中的表现，不仅推理准确率高于不使用工具的版本，其scaling曲线也更具效率——即单位算力带来的智能提升更大。在实际测试阶段，模型得分可较训练期进一步提升10个百分点，显示出极强的泛化与工具适应能力。专业能力全面开花，Grok-

加载中...

已阅读到文档的结尾了

下载文档