安全,  新闻

LlamaFirewall:开源框架助力检测与缓解AI核心安全风险

框架概述

LlamaFirewall 是一款面向大语言模型(LLM)应用的系统级安全框架,采用模块化设计支持分层自适应防御。该框架旨在缓解各类AI代理安全风险,包括越狱攻击(jailbreaking)、间接提示注入(indirect prompt injection)、目标劫持(goal hijacking)以及不安全代码输出等问题。

留言

您的邮箱地址不会被公开。 必填项已用 * 标注