安全, 新闻 LlamaFirewall:开源框架助力检测与缓解AI核心安全风险 2025年5月26日 / 框架概述 LlamaFirewall 是一款面向大语言模型(LLM)应用的系统级安全框架,采用模块化设计支持分层自适应防御。该框架旨在缓解各类AI代理安全风险,包括越狱攻击(jailbreaking)、间接提示注入(indirect prompt injection)、目标劫持(goal hijacking)以及不安全代码输出等问题。