文件列表:
海通国际:中国电子:推理力跃升10倍,理论性能对标GPT-5与Claude4Opus.pdf |
下载文档 |
资源简介
>
事件:
2025年7月9日,xAI正式发布其最新旗舰大模型Grok4,并于北京时间7月10日上午11点举行全球直播发布会。该模型在xAI自研的Colossus超级计算机上训练,跳过3.5版本,直接命名为Grok4。相较前代,Grok4在推理性能、多模态能力和上下文处理能力上均实现跃升。Grok4现已开放API访问,月费定价为30美元,重载多智能体版本Grok4Heavy定价300美元;未来将于8月推出编程模型、9月上线多模态智能体版本,并于10月支持视频生成模型。
点评:
训练强度大幅跃升,工具融合显著提升智能边界。Grok4的训练规模远超前代模型,计算资源投入为Grok-2的100倍、Grok-3的10倍,核心依托xAI自建的20万张GPU超算集群。训练过程中广泛引入RL技术,特别是在“人类最后考试”(HLE)基准中,工具融入训练显著提升了模型在复杂推理任务中的表现,不仅推理准确率高于不使用工具的版本,其scaling曲线也更具效率——即单位算力带来的智能提升更大。在实际测试阶段,模型得分可较训练期进一步提升10个百分点,显示出极强的泛化与工具适应能力。
专业能力全面开花,Grok-
加载中...
已阅读到文档的结尾了