大型语言模型中不道德建议的测试和修复：使用建议 - 批判 - 反思过程（英文版）

发布者：wx****b8

2023-05-05

689 KB 12 页

人工智能（AI）

文件列表：

大型语言模型中不道德建议的测试和修复：使用建议 - 批判 - 反思过程【英文版】.pdf

下载文档

资源简介

英文标题："Oops, Did I Just Say That?" Testing and Repairing Unethical Suggestions of Large Language Models with Suggest-Critique-Reflect Process中文摘要：本文提出了第一个用于测试和修复 LMMs 不道德建议的框架，包括测试套件 ETHICSSUITE、建议 - 评论 - 反思（SCR）流程、在线修复方案等，并使用 ETHICSSUITE 测试了 7 个流行的 LMM，发现了总计 109824 个不道德建议，并在 Llama-13B 和 ChatGPT 上应用了 OTF 方案，为更加注重伦理的 LMMs 铺平了道路。英文摘要：As the popularity of large language models (LLMs) soars across variousapplications, ensuring their alignment with human values has become a paramountconcern. In parti

加载中...

已阅读到文档的结尾了

下载文档