数智化转型网szhzxw.cn 人工智能人工智能专题|AAIG技术方向介绍——人工智能安全-大模型安全评估与防御

人工智能专题|AAIG技术方向介绍——人工智能安全-大模型安全评估与防御

作者: 数智化转型网www.szhzxw.cn 发布: 2024年11月8日

AAIG的技术方向——大模型安全评估与防御

大型语言模型（LLMs）在自然语言处理领域展现出革命性能力，但也可能生成违反社会规范的有害内容，因此在部署前对其安全性进行严格评估至关重要。为解决现有风险分类和自动化评估方法不足的问题，我们设计了一个包含8个维度和102个子类别的系统性风险分类体系，并提出了一个名为S-Eval的新框架。该框架由样本生成大模型和安全评估大模型组成，能自动生成风险提示并提供可解释的安全评估。相比以往的工作，S-Eval具有高效、有效和适应性强的特点，能够自动评估多种LLM的安全性而无需人工干预，并且可以随着LLM的发展不断调整和优化。

声明：本文来自网络，版权归作者所有。文章内容仅代表作者独立观点，不代表数字化转型网立场，转载目的在于传递更多信息。如有侵权，请联系我们。数字化转型网www.szhzxw.cn

数字化转型网人工智能专题

与全球关注人工智能的顶尖精英一起学习！数字化转型网建立了一个专门讨论人工智能技术、产业、学术的研究学习社区，与各位研习社同学一起成长！欢迎扫码加入！数字化转型网www.szhzxw.cn

本文由数字化转型网（www.szhzxw.cn）转载而成，来源于阿里巴巴人工智能治理研究中心；编辑/翻译：数字化转型网宁檬树。

数字化资料下载-思思

此图片的alt属性为空；文件名为%E5%AE%98%E7%BD%91%E8%AF%BB%E8%80%85%E7%BE%A42.png

免责声明: 本网站(http://www.szhzxw.cn/)内容主要来自原创、合作媒体供稿和第三方投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等) 版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时，请及时通知本站，予以删除。http://www.szhzxw.cn/48969.html

179赞

标签:人工智能专题