超过半数的成年人会通过互联网查询健康信息,其中三分之一的人会借助人工智能(AI)来获取相关资讯。然而,能够获取信息并不等同于能够准确理解或正确解读信息。因此,AI健康信息领域中人的因素仍然是重要的研究课题。
这一点在皮肤科领域(涵盖皮肤、毛发、指甲,以下统称"皮肤")尤为突出。人们在网上搜寻与皮肤问题相关的信息时,往往面临困难。例如,当你发现"腿上有红点"时,可能并不具备将其具体描述为"可触及性紫癜"的专业背景知识。
多年来,研究团队在这一领域构建了坚实的技术基础,包括开发用于辅助鉴别诊断的AI模型、验证模型的泛化能力,以及发布SCIN等数据集,以支持临床医生和研究人员的工作。然而,真正产生重大影响,需要为有皮肤问题的人提供高质量信息,从而支持其决策过程。
基于上述背景,本文分享了近期及过往关于消费者如何理解和使用皮肤科AI工具的相关研究成果。其中包括一项大规模定量研究,证明了AI辅助能够显著提升用户准确命名皮肤病症的能力,并在判断后续处理步骤方面带来一定收益;同时还涵盖一项深度混合方法研究,探讨了人们如何将这些工具应用于自身皮肤问题,以及由此获得的认知与医生沟通效果的对比。
大规模定量研究:AI如何提升用户对皮肤病症的理解
参与者被随机分配至三组:一组使用标准搜索工具作为对照,一组使用AI辅助工具,一组使用"绿野仙踪(Wizard of Oz)"实验设置,即接受与实际诊断完全吻合的"完美预测"。
研究结果显示,AI辅助在提升消费者理解方面具有统计学意义上的显著效果。使用AI工具的参与者中,愿意尝试命名所展示病症的比例超过62%,而使用标准搜索工具的对照组仅为41%。
更为关键的是,参与者在病症命名准确率方面取得了大幅提升。AI辅助组的准确率(23%)约为无辅助对照组(8%)的三倍。"绿野仙踪"组的准确率约为对照组的四倍(36%),但仍远未达到理想水平。AI"卡片"式展示匹配病症的方式,还显著提升了参与者对病症猜测结果的信心,以及对搜索结果和搜索时间的整体满意度。
后续步骤判断仍面临挑战
为避免工具过于主导用户判断,研究中的AI设计侧重于将图像与可能的病症进行匹配,并由用户自行解读应采取的后续措施。研究目标是帮助用户高效搜索信息,而非替用户作出诊断或处方建议。此外,相关处理建议和信息由皮肤科医生基于权威来源撰写,内容仅依据病症名称,并未针对具体案例的严重程度进行个性化定制。
或许正因为提供的信息较为笼统,用户在判断适当的后续医疗步骤时仍面临较大挑战,例如是选择居家处理还是紧急预约就诊。研究发现,虽然"绿野仙踪"组的后续步骤判断准确率略有提升(63.5% vs 对照组60%),但标准AI组并未呈现统计学意义上的显著改善。此外,与对照组相比,AI组的参与者更倾向于建议采取紧迫程度较低的后续处理方式(30% vs 27%)。
真实场景研究:多元社区的深度体验
大规模问卷研究在把握整体趋势方面具有重要价值,但研究团队也认识到,有必要深入了解人们在面对自身皮肤问题(而非他人病症图片)时如何解读相关信息。为了获取更丰富、更细腻的反馈,研究团队直接从最有可能受益于这些工具的社区中征集了深度定性见解。
去年,相关成果以《借助AI应对皮肤问题:皮肤科应用在多元社区中以人为本的研究》为题,发表于ACM人机交互(CHI)会议。该研究与斯坦福医疗AI应用研究团队(HEA3RT)及圣克拉拉家庭健康计划(SCFHP)合作开展。SCFHP服务于周边社区,其中许多成员依赖加州医疗救助计划(Medi-Cal)获得医疗保障。研究旨在观察来自多元背景、知情同意的参与者在真实场景中实际使用皮肤AI系统,并了解其对系统所提供信息的反应。
为确保工具真正服务于目标社区,研究团队将AI应用翻译成参与者使用的四种主要语言,并安排相应语言流利的志愿者或工作人员在场协助沟通。
在这项真实场景研究中,110名知情同意的参与者使用了该应用(并在使用后立即与临床医生进行咨询以解答疑问)。与上述问卷研究结果类似,使用该应用后,参与者命名自身病症的能力提升了260%,尽管正确猜测率整体偏低。参与者高度依赖将教科书图像与自身皮肤状况进行视觉对比匹配,这凸显了收录多种肤色、不同严重程度及不同部位病症图像的重要性,以便用户进行有效的"模式匹配"。
参与研究的临床医生认为,该应用的预测结果与其自身对病症的评估总体吻合(吻合率为86%)。由于参与者可以在临床咨询过程中打开应用,临床医生也得以将其作为共同参考工具,进而促进医患沟通。临床医生有92%的情况认为该应用是一个有帮助的工具。
研究展望与未来方向
上述研究聚焦于利用基于图像的AI,帮助来自多元背景的用户更好地理解皮肤状况。研究揭示的主要改进方向包括:提供更多教科书式示例以引导用户理解和模式匹配,以及提供更具针对性的可操作信息,以更贴近用户的实际查询需求(而非仅停留在病症层面)。此外,基于图像相似性工具的研究还表明,普通用户更倾向于采用图像与文本相结合的多模态AI皮肤病症信息搜索方式,而非单独使用其中一种。
综合来看,这些研究共同描绘出皮肤病症信息搜索的未来图景:以视觉为入口可以降低使用门槛,更具个性化的AI引导有助于用户梳理复杂的医疗信息。然而,要打造真正高效的工具,仍需持续开展以人为本的研究,确保每个人都能有效理解并运用这些信息,从而更好地支撑自身的健康医疗之旅。
Q&A
Q2:AI皮肤工具能不能帮用户判断是否需要去医院?
Q3:皮肤AI应用在多元社区的真实场景中效果怎么样?
A:效果总体积极。在与斯坦福医疗AI应用研究团队合作开展的研究中,110名参与者使用皮肤AI应用后,命名自身病症的能力提升了260%。临床医生认为该应用预测与其自身评估的吻合率达86%,并在92%的情况下将其视为有帮助的工具。该应用还被翻译为四种语言,有效降低了语言障碍,展现了其在多元社区中的适用潜力。