×
img

斯坦福大学:2025年人工智能指数报告

发布者:wx****8d
2025-06-17
12 MB 456 页
人工智能(AI) 斯坦福大学
文件列表:
斯坦福大学:2025年人工智能指数报告.pdf
下载文档

人工智能在严苛比较基准测试中的性能持续提升。2023 年,研究人员推出了 MMMU、GPQA 和 SWE-bench 等一系列新型比较 基准,旨在测试前沿人工智能系统的极限。仅一年后,性能就大幅提升:MMMU、GPQA 和 SWE-bench 的得分分别提高了 18.8%、 48.9% 和 67.3%。除这些比较基准,人工智能系统在生成高质量视频方面也取得了重大进展,在某些特定场景下,基 于语言模型的智能体在时间受限的编程任务中甚至表现优于人类。


加载中...

本文档仅能预览20页

继续阅读请下载文档

网友评论>

开通智库会员享超值特权
专享文档
免费下载
免广告
更多特权
立即开通

发布机构

更多>>