文件列表:
山西证券:计算机行业快报:Grok3正式发布,头部模型推理性能进一步提升.pdf |
下载文档 |
资源简介
>
事件描述:
2月18日,Grok3(Beta版)正式发布,并面向X的PremiumPlus订阅用户率先开放,同时推出了每月30美元或每年300美元的SuperGrok单独订阅服务,订阅用户可解锁深度搜索等先进功能,而语音交互功能将在约一周后上线。
事件点评:
Grok3和Grok3mini在多方面性能上均超过或媲美Gemini、DeepSeek和ChatGPT等对手。根据官方公布的测试数据,Grok3和Grok3mini在数学推理(AIME)、科学逻辑推理(GPQA)和代码写作(LCB)的基准测试上性能表现优于DeepSeekV3、GPT-4o、Gemini2Pro及Claude3.5Sonnet,其中,Grok3性能较DeepSeekV3提升了27%-43%。而在推理能力测试中,Grok3和Grok3mini推理模型的性能再次刷新了sota,其中,相较于DeepSeekR1,Grok3的性能表现提升了16%-22%。
得益于思维链推理能力的引入,Grok3在解决复杂任务方面的表现较为突出。Grok3在发布会的演示上完成了多个复杂任务,包括正确编码并实现飞船从地球发射、登陆火星、到在下
加载中...
已阅读到文档的结尾了