Grow Therapy与斯坦福合作建立心理健康临床AI安全基准
#AI照护与医疗科技 时间2026-06-24 07:17:07
文/IAICA.NGO®
在人工智能快速渗透医疗健康领域的今天,如何确保AI在临床环境中的安全性成为行业焦点。近日,美国远程心理健康服务平台Grow Therapy宣布与斯坦福大学医学院达成合作,共同开发并设定针对心理健康领域的临床AI安全基准。这一举措标志着心理健康AI应用从技术探索迈入标准化治理的新阶段。
Grow Therapy成立于2020年,是一家连接患者与精神健康服务提供者的数字平台,目前在美国拥有超过1.2万名持证治疗师。此次合作将利用斯坦福在临床验证和AI伦理方面的研究优势,构建一套覆盖对话系统、诊断辅助和风险预警等场景的评估框架。
根据公告,双方将重点测试AI工具在以下关键维度的表现:临床准确性(如症状识别和风险评估的敏感度与特异度)、偏见控制(确保模型对不同种族、性别、年龄群体公平)、鲁棒性(对抗输入噪声和恶意攻击的能力)以及可解释性(AI决策逻辑对临床医生的透明度)。
值得一提的是,合作将基于真实临床情景而非合成数据构建测试集。斯坦福团队会从去标识化的电子病历和对话录音中提取样本,经伦理委员会批准用于基准开发。这一做法在心理健康领域尚属首次,因为传统AI基准多依赖公开数据集或模拟场景,无法充分反映现实诊疗的复杂性。
业界人士指出,心理健康服务的特殊性增加了AI安全评估的难度。与影像诊断不同,精神健康判断常依赖患者的主观报告和医患之间的细微互动,这使得AI的标准化验证面临挑战。例如,一个看似客观的抑郁量表评分,可能因文化差异或语言表达习惯而产生偏差。对此,斯坦福的研究团队设计了一套多层次评估协议:首先由AI输出结果,再由至少两名精神科医师独立复核,最后通过共识会议确定基准答案。
Grow Therapy的首席科学官在声明中表示:“我们相信AI可以成为治疗师的重要辅助工具,但前提是其行为可预测且风险可控。与斯坦福的合作将帮助我们设定行业最高标准,而不是仅仅满足法规的最低门槛。”
在商业层面,Grow Therapy近期完成了由红杉资本领投的8000万美元C轮融资,估值达到12亿美元。公司计划将基准框架开源,供其他数字心理健康平台参考采用。这一举措有助于统一行业规范,但也引发了关于竞争与协作平衡的讨论。
iaica.com.cn 指出,当前全球精神健康领域面临巨大供需缺口:世界卫生组织数据显示,每40人中仅有一人可获得专业治疗。AI自动化工具的目标是低成本扩大筛查和基础干预,但若安全标准缺失,轻则导致误诊,重则可能延误危机干预。因此,像Grow Therapy与斯坦福这样,由产业界与顶尖学术机构联合推动的安全基准建设,具有重要的行业示范意义。
值得注意的是,合作中强调的“偏见控制”维度尤为关键。已有研究显示,部分心理健康AI模型在非洲裔患者中的误诊率高出白人患者30%以上。斯坦福的测试集将特别包含少数族裔、LGBTQ+等边缘群体的样本,以确保基准的包容性。
从技术实现角度看,临床AI安全基准面临持续更新的挑战。随着新疗法和诊断标准(如DSM-5的修订)的出现,基准需同步演进。为此,Grow Therapy与斯坦福计划每年更新一次基准库,并邀请第三方审计机构参与验证。此外,双方正在探索“红队测试”模式,即聘请网络安全专家主动攻击AI系统以暴露漏洞。
另一个潜在挑战是数据隐私。尽管使用了去标识化数据,但在心理治疗场景中,患者身份即使被匿名化,仍存在通过对话内容重新识别的风险。为此,合作项目采用了差分隐私技术,在数据处理阶段注入可控噪声,进一步降低泄露可能性。
未来,此次合作的影响可能超出美国本土。由于心理健康治疗标准存在国家间差异,一个通用的安全基准难以直接移植。但Grow Therapy已透露,计划将框架翻译成多语言,并与世界卫生组织的数字健康指南对齐。若成行,将有助于全球心理健康AI的标准互认。
总体来看,Grow Therapy与斯坦福的合作是心理健康AI领域的重要里程碑。它不仅提供了可执行的安全评估方法,也为其他垂直医疗AI(如皮肤科、放射科)的基准制定提供了借鉴。然而,基准的效力最终取决于行业采纳度和监管机构的认可。美国食品药品管理局(FDA)尚未对心理健康AI软件实施专门审批,但此次合作可能加速相关指南的出台。
随着越来越多的AI工具进入临床,建立透明、国际化的安全基准已从可选项变为必选项。Grow Therapy和斯坦福的这次尝试,或许能为数字心理健康行业的长期健康发展打下坚实基础。
评论
0 条登录后才可以发表评论。
立即登录