英国人工智能安全研究所:2025年国际人工智能安全报告-执行摘要.pdf |
下载文档 |
资源简介
本文是《先进人工智能安全国际科学报告》2025年1月版,由来自30个国家的96位人工智能专家共同完成。报告主要关注通用型人工智能(AI)的安全性,包括其能力、风险和风险管理技术。
报告指出,通用型AI的能力近年来迅速提升,未来数月乃至数年内的发展速度存在分歧。AI的扩展(Scaling)是提升其能力的关键,但进一步扩展存在潜在瓶颈。AI在科学和编程测试中已达到专家级表现,自主智能体(AI Agent)的开发正在加速。
报告详细讨论了AI的恶意使用风险、故障风险和系统性风险。恶意使用风险包括虚假内容生成、操纵公众舆论、网络攻击和生物化学攻击。故障风险包括可靠性问题、偏见和失控风险。系统性风险包括劳动力市场影响、全球AI研发鸿沟、市场集中度、环境风险和隐私风险。
报告还指出,风险管理技术尚处于起步阶段,但取得进展是有可能的。风险评估、监控和预防措施是风险管理的重要组成部分,但存在局限性。解释AI决策有助于管理风险,但目前尚无可靠方法防止不安全输出。
最后,报告强调,通用型AI的未来发展轨迹取决于社会和政府的选择。
本文档仅能预览20页