协和眼科牵头 ,5 家眼科中心同发力,用 AI 助力 13 种眼底疾病检测

特色图像

眼睛方寸之间,疾病千差万别。去年底,由爱康集团与鹰瞳 Airdoc  联合发布的《四百万体检人群健康蓝皮书》显示,近年来眼底异常的总检出率连年上升,已从 2019-2020 年的 76.1%,上升至 2022-2023 年的 78.7% 。眼底疾病的发病率持续攀升,已成为世界范围内最常见的不可逆致盲因素。

由于眼科疾病的诊断高度依赖于图像识别,眼科专业非常适合深度学习等技术的应用。为了进一步挖掘深度学习在眼底疾病诊断中的潜在价值,由北京协和医院眼科主任陈有信牵头、全国 5 家眼科中心(北京协和医院眼科、四川大学华西医院、河北医科大学第二医院、天津医科大学眼科医院、温州医科大学附属眼视光医院)与北京致远慧图科技有限公司、中国人民大学信息学院李锡荣教授合作,通过开发深度学习系统 (DLS, deep learning system),助力初级眼科医生的诊断一致性提高了约 12%,为 13 种主要眼底疾病的自动检测提供了一种新的方法。

研究亮点:
* 本研究通过前瞻性临床试验,旨在评价 DLS 在协助初级眼科医生检测 13 种主要眼底疾病方面的诊断性能

* 采用 DLS 后,初级眼科医师的诊断一致性提高了约 12%
* DLS 应该能够检测到至少一种现有疾病,这与定义新指标的初衷一致

论文地址:
https://doi.org/10.1038/s41746-023-00991-9
关注公众号,后台回复「DLS」获取完整 PDF

DLS:打开眼底疾病诊断新思路

数据集:网罗眼底图像,确保结果准确

相比此前研究,本研究收集了更多的彩色眼底摄影数据,将数据总量扩大到 81,395 张图像(训练集 77,181 张、 验证集 1,087 张,测试集 3,127 张)。

模型构成:两大研究模型,协同构建流程

DLS 由图像质量评估模型 (quality assessment model) 和诊断模型 (diagnostic model) 两部分组成,工作流程如下图所示:

DLS 的工作流程

图像质量评估模型是建立在 ResNet-34 CNN 之上的回归模型,通过输入单幅眼底图像,从图像质量评估模型入手,判断图像质量是否适合诊断。如果适合,诊断模型将生成诊断建议;反之,系统会发出警报,提示图像质量不适合诊断,但系统无法提供诊断建议。

眼底疾病诊断模型是基于此前工作的扩展,以 CNN 模型 seResNext50 为主要结构。全连接层设计有两个分支,用于确定是否存在疾病,以及存在哪些特定疾病。为了更好地稳定预测结果,该研究训练了 3 个具有后期融合的并行 seResNext50 模型。

研究设计:五大医院联动,多因素确保结果可靠

本研究在北京协和医院、四川大学华西医院、河北医科大学第二医院、天津医科大学眼科医院、温州医科大学眼科医院 5 家三级医院开展。从 2020 年 8 月至 2021 年 1 月,共有 750 名参与者进行了前瞻性筛选,其中 748 人完成了所有手术。参与者均为年龄介于 18 至 75 岁的门诊病人,平均年龄为 51.7 岁,分别患有糖尿病 152 例 (20.3%) 、高血压 216 例 (28.9%) 和高血脂 104 例 (13.9%) 。其中,男性患者 324 例 (43.3%) 。他们都曾到 5 家医院的任意一家接受眼底影像检查,均有完整的医疗记录,并接受了全面的眼科检查。

研究邀请到了 6 位眼科专家(至少工作 5 年的副教授)对图像进行标注,最终以他们共同讨论决定的诊断结果最为核定标准。此外,还有 9 名初级眼科医生(住院医师或年资少于 3 年的主治医师)接受了培训,并在研究中阅读图像进行评估。

经过一周的洗脱期后,他们会再次对同一组图像进行标注,这些图像被随机重新排序并贴上 DLS 先前标注的标签,形成试验组。同时,每位初级眼科医生均被分配独立标注部分数据集,作为对照组。另外,所有入组眼底图像均经 DLS 标记为 DLS 组。

该研究可完全分析的图像子集为 1,493 张,根据 6 名资深眼科医师的批注和讨论,其中 477 张 (32.0%) 眼底标记为正常。另有 1,016 张 (68.1%) 图像标记疾病,其中有 1,386 张 (92.8%) 仅标记一种疾病,78 张 (5.2%) 标记了两种疾病,29 张 (1.9%) 标记了 3 种疾病,共有 251 张 (16.8%) 的图像被标注为「其他异常」。

研究流程及各组主要研究指标结果

眼底图像由熟练的技术人员用双眼(非)散瞳眼底相机拍摄,采用标准操作程序,以确保后续标注和读取的图像质量。

入选和排除标准的参与患者和眼底图像

本研究的疾病选择是根据其流行程度和对视觉功能的威胁来决定,同时也考虑到使用眼底图像进行筛查的临床潜力。最终,研究选择了 13 种具有标准诊断标准的主要眼底疾病,包括可转诊的糖尿病视网膜病变 (DR) 、视网膜静脉阻塞 (RVO) 、视网膜分支动脉阻塞 (RAO) 、病理性近视、视网膜脱离 (RD) 、原发性视网膜色素变性 (RP) 、萎缩性和新生血管性老年黄斑变性 (AMD) 、视网膜前膜 (ERM) 、黄斑裂孔 (MH) 、中心性浆液性脉络膜视网膜病变 (CSC) 、疑似青光眼性视神经病变 (GON) 和视神经萎缩等。如果图像中包含其他疾病的征象,但不包括在所选的 13 种疾病中,则将其归入「其他眼底异常」类别。

三组实验针对不同疾病诊断的敏感性、特异性及 F1 值

实验结果:DLS 可有效发现特定眼底疾病,也会影响诊断准确性

与对照组相比,初级眼科医生有 888 张 (59.4%) 图像的标注发生了改变。其中 801 张 (53.5%) 图片根据 AI 的建议进行了修改。虽然在某些情况下,初级眼科医生会根据 DLS 的建议误将原本正确的诊断决定改为错误标签,但其也确实从中得到了很多帮助。

各类别医生改变诊断决定的情况
蓝色是变更为错误诊断标签,红色是变更为正确标签

该研究表示,这是首次证明 DLS 可以帮助初级眼科医生在多种重大眼底疾病的检测中显著提高诊断一致性的临床试验,同时也证明了初级眼科医生基于 DLS 辅助的多重眼底疾病筛查图像阅读模式是一种有效的临床方法。

在该研究中,DLS 的总体疾病诊断敏感性和特异性分别达到 96.6% 和 81.8%,可以有效地发现特定的眼底疾病,发现眼底异常,并协助患者转诊进行专门的调查和评估。此外,高特异性有助于减少不必要的转诊和医疗费用。

该研究设置了 3 个对照组,分别为 AI 辅助医生阅片组(试验组),医生独立阅片组(对照组)和 AI 阅片组(AI 组)。

结果显示,试验组、对照组和 AI 组诊断一致率分别为 84.9% 、 72.9% 和 85.5%,即在 AI 辅助下,低年资医师读图诊断能力可提高约 12% 。在本研究中,试验组和 DLS 组的诊断一致性相似,这表明单独使用 DLS 可以充分发挥作用。然而,让人类医生参与进来仍然至关重要。尽管基于人工智能的疾病筛查和识别已经被广泛应用于实际临床实践,但其也引入了误诊等相关风险。

此外,在本研究中,试验组和对照组对眼底疾病的敏感性相当,且试验组明显优于对照组,特别是对包括疑似 GON 、视神经萎缩、萎缩性 AMD 、和 CSC 等疾病。这些结果表明,初级眼科医生能够区分眼底异常与正常,但对特定疾病的诊断仍有缺失,这一缺陷可以通过 DLS 辅助来解决,从而大大降低漏诊率,同时也减少了初级眼科医生对眼底疾病诊断的专业化程度限制。

但是,对照组的诊断准确率 (60.5%) 高于试验组 (44.2%) 。通过回顾标注,该研究发现 DLS 倾向于为一张图像标注更多的标签,这将有助于减少初级眼科医生的漏诊,但同时也会影响诊断的准确性。

此外,该研究仍然具有一定的局限性。首先,尽管数据集选定了眼底疾病的真实图像,但其中一些类别仅包含少量图像,这可能导致结果存在偏差,而且所有参与者均为中国汉族患者。在未来的工作中,还需要进一步扩大前瞻性数据集,丰富患者的类型。

其次,本研究选择的一些疾病需要从视网膜周围区域开始收集,这超出了眼底图像的范围。因此,DLS 在初始阶段无法检测到它们。研究采用宽视场彩色眼底摄影,可以在一定程度上解决这一问题。

第三,由于在 DLS 的帮助下,初级眼科医生的诊断能力得到了很大的提高,该技术也可以作为用于教育目的应用场景,这也是一个有意义的课题,需要在今后的工作中进行更全面的考察和评价。

陈有信教授深耕眼底医学,推进 AI 应用

「北京协和医院有多牛?」——这是某中文社交媒体上活跃的一个帖子,下面无数的跟帖用一个个罕见病例论证着北京协和医院的医术高超。作为「东方的维也纳眼科中心」,协和医院眼科也长期活跃在行业第一梯队,其现任现任科主任陈有信可谓是中国眼科发展史的见证者和创造者。

1993 年,初入眼科领域的陈有信医师,作为张承芬教授的眼底病学博士来到协和医院。 2001 年,远在美国留学的陈有信教授收到了来自当时中华医学会眼科学分会的主委赵家良教授的邮件,邮件中提到希望他能早日回国帮助筹备次年的第 8 届全国眼科学术大会。经过深思熟虑,陈有信最终提前终止学业,选择回国搭建全国眼科年会这个后来帮助了无数中国眼科医生打开视野的平台。

在眼底医学方面,陈有信教授深耕久远。 1982 年,美国 Yannuzzi 教授在一场黄斑学会的会议上,首次报道并命名了一种眼底病:特发性脉络膜息肉样血管病变 (Polypoidal choroidal vasculopathy, PCV) 。随着研究的深入,学者发现此病在亚洲人群中发病率最高,庞大人群基数也导致我国此病病患较多。 2017 年,由陈有信教授发起的中国眼科界首个「PCV 研究联盟」成立。

随后,陈有信教授牵头联合国内多家单位开展了 START 研究,即康柏西普眼用注射液治疗 PCV 的真实世界研究。最终,由陈有信教授团队领衔的「息肉状脉络膜血管病变诊疗体系的建立及理论创新」荣获 2022 年度华夏医学科技奖二等奖。

此外,本论文的第一作者李冰师从陈有信教授及北京协和医院眼科眼底病专家叶俊杰教授,目前任北京协和医院眼科住院医师,已经作为第一作者发表 SCI 及中文核心期刊论文 10 余篇,多次在全国眼科年会、全国眼底病会等学术会议作报告。

在 AI 辅助识别眼底病方面,协和眼科走在时代最前沿。早在 2021 年,陈有信教授已经通过人工智能成功识别了静脉阻塞、糖尿病病变、黄斑变性等多个病种,这个也获得了北京市重点课题的资助 500 万元。

目前,协和医院眼科已经开展了人工智能在眼科疾病筛查、治疗预测、眼与全身病关联性、多模态和广角眼底病变及多病种病变识别研究,并且在很多基层场景得到了应用推广,为解决因医疗资源发展不均衡导致的看病难看病贵的问题,提供了思路和解决办法。

在陈有信教授看来,所有的努力都是旨在把医疗资源下沉下去,为那些远离大城市的患者提供更好的诊治。借由人工智能等技术的发展,陈有信教授的努力已经初见成效,未来也将持续攻坚克难,在相关疾病的发病机制、发病规律、诊断及治疗等方面持续发挥人工智能的力量。

参考资料:
1.https://mp.weixin.qq.com/s/zctJN7Q7PYjsPypkStWcoA

2.https://mp.weixin.qq.com/s/LoXWmWVpYnrr1-vKBrpL6A

3.https://mp.weixin.qq.com/s/IFS5JWIyb_5mqfJccAQO2g

4.https://mp.weixin.qq.com/s/zxP9n_vGWNcH2rPW-dq37g

5.https://www.pumch.cn/detail/34540.html