×
img

大型语言模型中不道德建议的测试和修复:使用建议 - 批判 - 反思过程(英文版)

发布者:wx****b8
2023-05-05
689 KB 12 页
人工智能(AI)
文件列表:
大型语言模型中不道德建议的测试和修复:使用建议 - 批判 - 反思过程【英文版】.pdf
下载文档
英文标题:"Oops, Did I Just Say That?" Testing and Repairing Unethical Suggestions of Large Language Models with Suggest-Critique-Reflect Process中文摘要:本文提出了第一个用于测试和修复 LMMs 不道德建议的框架,包括测试套件 ETHICSSUITE、建议 - 评论 - 反思(SCR)流程、在线修复方案等,并使用 ETHICSSUITE 测试了 7 个流行的 LMM,发现了总计 109824 个不道德建议,并在 Llama-13B 和 ChatGPT 上应用了 OTF 方案,为更加注重伦理的 LMMs 铺平了道路。英文摘要:As the popularity of large language models (LLMs) soars across variousapplications, ensuring their alignment with human values has become a paramountconcern. In parti

加载中...

已阅读到文档的结尾了

下载文档

网友评论>