×
img

启明星辰:2025年DeepSeek-R1-Distill全版本安全评估报告

发布者:wx****fb
2025-02-20
2 MB 10 页
人工智能(AI)
文件列表:
启明星辰:2025年DeepSeek-R1-Distill全版本安全评估报告.pdf
下载文档

本文对DeepSeek-R1的多个版本进行了全面的安全性评估,包括蒸馏版本和量化版本。评估发现,模型参数量越大,安全性越高。针对大模型生成内容可能带有偏见或产生误导信息的问题,文章提出了“前置预防-动态评估-主动修正”的大模型安全治理范式,并基于电子围栏技术提出了一种安全防护方案。通过安全评估,可以有效掌握大模型的风险和脆弱性问题,为后续的安全防护提供依据。同时,通过集成防护能力,可以提升大模型的安全性。


加载中...

已阅读到文档的结尾了

下载文档

网友评论>

开通智库会员享超值特权
专享文档
免费下载
免广告
更多特权
立即开通

发布机构

更多>>