-
-
SDC2024议题聚焦 | ExpAttack大语言模型越狱风险持续追踪框架
-
发表于: 2024-10-17 18:33 2349
-
01
ExpAttack大语言模型越狱风险持续追踪框架
大语言模型技术和应用正在迅猛发展。一方面,大模型解放了社会生产力;另一方面,它们也带来了不断增加的内容安全风险。作为一项全新的技术,大语言模型的风险会随着时间逐渐显现。
在传统的安全领域,为了应对快速变化的网络攻击并减少来自未来的风险,Gartner引入了CTEM(持续威胁暴露管理)。借鉴Gartner的思路,我们提出了ExpAttack框架,这是一种“可成长”的系统,能够持续监测和追踪大语言模型的越狱风险,本议题将分享ExpAttack框架相关的技术细节。
02
演讲嘉宾——Knight
京东蓝军白鵺攻防实验室安全研究员。
多年实战攻防经验,多次参加全国HW、各省市HW,并参与过深信服SRC、字节SRC、GeekCon分享。目前主要研究大语言模型安全以及大语言模型赋能安全。
03
听众收获
1. 了解大语言模型越狱风险的概念和现状和影响;
2. 学习ExpAttack框架的技术细节,包括其设计原理、工作流程和应用场景;
3. 掌握大语言模型安全风险管理的方法和策略
4. 了解大语言模型赋能安全的概念和应用,例如如何使用大语言模型来增强安全能力;
5. 获取Knight在大语言模型安全领域的研究和实践经验。
更多议题细节,欢迎来峰会现场聆听
[注意]传递专业知识、拓宽行业人脉——看雪讲师团队等你加入!
赞赏
他的文章
看原图
赞赏
雪币:
留言: