文件列表:
大型语言模型中不道德建议的测试和修复:使用建议 - 批判 - 反思过程【英文版】.pdf |
下载文档 |
资源简介
>
英文标题:"Oops, Did I Just Say That?" Testing and Repairing Unethical Suggestions of Large Language Models with Suggest-Critique-Reflect Process中文摘要:本文提出了第一个用于测试和修复 LMMs 不道德建议的框架,包括测试套件 ETHICSSUITE、建议 - 评论 - 反思(SCR)流程、在线修复方案等,并使用 ETHICSSUITE 测试了 7 个流行的 LMM,发现了总计 109824 个不道德建议,并在 Llama-13B 和 ChatGPT 上应用了 OTF 方案,为更加注重伦理的 LMMs 铺平了道路。英文摘要:As the popularity of large language models (LLMs) soars across variousapplications, ensuring their alignment with human values has become a paramountconcern. In parti
加载中...
已阅读到文档的结尾了