评估大型语言模型在心理健康支持中的风险：自动化临床人工智能红队评估框架

2026年2月28日 /

作者：Ian Steenstra, Paola Pedrelli, Weiyan Shi
译者：知道创宇404实验室翻译组
原文链接：https://arxiv.org/pdf/2602.19948
摘要
大型语言模型（LLMs）正越来越多地应用于心理健康支持领域，然而当前的安全基准往往无法检测到治疗对话中固有的复杂、纵向风险。本文提出一种评估框架，将人工智能心理治疗师与搭载动态认知-情感模...