OpenAI安全护栏框架破绽百出，简单提示注入即可绕过

2025年10月14日 /

OpenAI最新推出的Guardrails安全框架旨在通过检测有害行为来增强AI安全性，但研究人员已利用基本提示注入方法迅速攻破该