启明星辰：2025年DeepSeek-R1-Distill全版本安全评估报告

发布者：wx****fb

2025-02-20

2 MB 10 页

人工智能（AI）

文件列表：

启明星辰：2025年DeepSeek-R1-Distill全版本安全评估报告.pdf

下载文档

资源简介

本文对DeepSeek-R1的多个版本进行了全面的安全性评估，包括蒸馏版本和量化版本。评估发现，模型参数量越大，安全性越高。针对大模型生成内容可能带有偏见或产生误导信息的问题，文章提出了“前置预防-动态评估-主动修正”的大模型安全治理范式，并基于电子围栏技术提出了一种安全防护方案。通过安全评估，可以有效掌握大模型的风险和脆弱性问题，为后续的安全防护提供依据。同时，通过集成防护能力，可以提升大模型的安全性。

加载中...

已阅读到文档的结尾了

下载文档