LlamaFirewall：开源框架助力检测与缓解AI核心安全风险

2025年5月26日 /

框架概述

LlamaFirewall 是一款面向大语言模型（LLM）应用的系统级安全框架，采用模块化设计支持分层自适应防御。该框架旨在缓解各类AI代理安全风险，包括越狱攻击（jailbreaking）、间接提示注入（indirect prompt injection）、目标劫持（goal hijacking）以及不安全代码输出等问题。

一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

框架概述

留言 取消回复

留言取消回复