安全,  新闻

评估大型语言模型在心理健康支持中的风险:自动化临床人工智能红队评估框架

作者:Ian Steenstra, Paola Pedrelli, Weiyan Shi
译者:知道创宇404实验室翻译组
原文链接:https://arxiv.org/pdf/2602.19948
摘要
大型语言模型(LLMs)正越来越多地应用于心理健康支持领域,然而当前的安全基准往往无法检测到治疗对话中固有的复杂、纵向风险。本文提出一种评估框架,将人工智能心理治疗师与搭载动态认知-情感模...

留言

您的邮箱地址不会被公开。 必填项已用 * 标注