机器之心专栏
机器之心编辑部
值得关注的是,对于超过3.5亿的适龄妇女人群,即使以3-5年进行一次筛查的标准来衡量,我国目前的宫颈癌筛查覆盖地区和人群数量仍然远远不足。来自腾讯天衍实验室的AI电子阴道镜辅诊系统有望为「两癌筛查」提供助力,辅助宫颈癌筛查全面落地应用和推广,最大化释放医疗普惠价值,助推我国医疗资源均衡化发展。
当第一次听到医生的诊断结果,宫颈癌患者最本能的反问就是「我怎么会得宫颈癌?」而且很多人感到疑惑,明明才刚检查出来,怎么就晚期了?
宫颈癌是目前唯一病因明确、唯一可以早期预防和治疗、唯一可能基本消灭的癌症。也就是说,只要早诊早治,宫颈癌完全可以预防、早期发现及治愈。但据全球癌症统计报告显示,仅 2020 年我国宫颈癌新发病例约 11 万,死亡人数约 5.9 万。
由于经济发展的不均衡性, 许多不发达地区接受教育程度低,不熟知宫颈癌的早期临床表现,加上基层医务人员专业知识水平不足,早期筛查的可能性极低,故使得宫颈癌误漏诊率较高,导致部分宫颈癌一经确诊即为中晚期,错失了手术治疗机会,显著影响了患者的预后。因此,早期筛查宫颈癌成为临床面临的一大重任。
宫颈癌筛查挑战重重
我国大部分的宫颈癌发病群体集中在医疗条件相对较差的地区。早在 2009 年,全国妇联、卫生部就共同启动了全国农村妇女和城镇户籍困难妇女「两癌」(乳腺癌和宫颈癌)检查项目,旨在通过筛查减少宫颈癌的发病率。近日,国家卫生健康委员会最新公布数据显示全国宫颈癌检查已覆盖近 2600 个县市区,免费检查 1.2 亿人次,成效显著。但客观来看,相比超 3.5 亿适龄妇女人群,即使以 3-5 年进行一次筛查的标准来衡量,目前我国的宫颈癌筛查覆盖地区和人群数量仍然远远不足。
而与庞大的适龄筛查人群形成鲜明对比的是,基层妇科医师资源与能力严重不足。统计显示,我国有 80 万妇科医生,懂得阴道镜检查和诊断的医生不足妇科医生总量的 1/20。尤其在资源匮乏的偏远地区,宫颈病灶复杂程度高、专业阴道镜医生稀缺、医疗水平层次不齐,阴道镜检查的准确性相对较低,漏诊、误诊的情况时有发生,严重影响宫颈癌的筛查和预防效果。因此,尽管中国政府连续在全国范围内实施免费宫颈癌筛查计划,但到 2015 年仍有超过 30500 名女性死于宫颈癌。
同时,在筛查技术层面也面临难以突破的 「瓶颈」。宫颈癌筛查目前采用的是「三阶梯」 法:HPV 检测或宫颈脱落细胞学初筛(TCT 或巴氏涂片)、初筛阳性者的阴道镜检查与活检、宫颈病理确诊,三个阶梯逐步推进。而阴道镜检查为宫颈癌筛查和诊断之间架起了一座桥梁,被作为诊断 CIN(宫颈上皮内瘤变)和宫颈癌的最常用方法之一,如果初筛发现疑似宫颈病变,通过阴道镜明显检查发现患者可能患有宫颈上皮内瘤变或癌症,就需要阴道镜活检(活体组织检查)做出更确切的诊断。
阴道镜师可通过阴道镜将宫颈放大若干倍,以观察到肉眼无法看见的上皮及血管变。阴道镜下多点活检是在宫颈阴道涂碘液与醋酸溶液着色后,多点定位取活体组织进行检查,可发行细微的病灶,提高宫颈疾病诊断的准确率。且与传统直视下宫颈活检相比较,可降低漏诊率,提高活检阳性率。
然而阴道镜下多点活检存在以下局限性:一方面阴道镜下无法看到宫颈管内病变,特别是对于鳞状上皮交界缩入颈管内或宫颈萎缩者,需要通过进一步检查(如宫颈管诊刮)确诊;另一方面,需要先进的阴道镜设备及具备丰富经验的阴道镜医师,才能取得可靠活检标本,进行病理检验,且活检取材必须够深、够大,因此阴道镜多点活检无法应用于门诊普查中。
而且宫颈活检本身也存在缺点。其一,因一般活检组织很小,常只有一条组织而无间质,此情况往往不能确定为原位癌或浸润癌,因此对诊断是否浸润不理想,尤其当肿瘤细胞的数量很少且异形性不明显,或伴糜烂坏死时;其二,制片所需时间长,一般都在十几个小时以上,因此一般需要数天才出结果,有时可能延误患者的治疗;其三,宫颈活检存在一定的假阴性(指实际有病但检查未发现)。
造成宫颈活检假阴性的原因又包括取材部位不当,特别是宫颈肿瘤中发现的原位癌,因患者没有临床症状,检查时部分患者宫颈光滑或轻度糜烂;取材组织过小,组织挤压严重,在制片过程中组织破碎;取材为大量坏死物,以致癌细胞相对很少,以及取材标本多依赖于医生的主观经验,一旦医生出现失误,会直接耽误很多患者在癌变前期或早期癌变阶段获得及时诊疗。
如何用 AI 辅助诊断宫颈癌
如何破解阴道镜下活检技术瓶颈,能否通过智慧科技辅助医生精准对宫颈病变区域进行判断、分割,以及进行精准活检取样,以辅助医生更高效准确的进行宫颈癌前病变判读,随着人工智能、大数据技术的飞速发展,为宫颈病筛查技术研发创新应用带来了新思路。
在中国医学科学院北京协和医学院乔友林教授团队的指导下,由腾讯觅影牵头,腾讯天衍实验室提供算法支持,经过大量实验研究,开发推出了一款基于深度学习的宫颈上皮内瘤变(CIN)和宫颈癌诊断的 CAD 系统——AI 电子阴道镜辅诊系统,实现了利用 AI 技术辅助医生阅片及进行阴道镜下癌前病变的辅助诊断,作为阴道镜医师的 「AI 助手」,能帮助阴道镜医师几十秒内智能识别异常患者,大大节省医生工作量的同时,有效提升了宫颈癌筛查准确率,帮助基层医生跨越「技术鸿沟」 掌握宫颈癌筛查领先科技手段,已经过大量实验和研究证明其准确率可达到专家级阴道镜师诊疗水准,在真实临床场景中拥有无限潜力。
AI 电子阴道镜辅诊系统有望为全国宫颈癌筛查服务开启「加速度」,并作为一种低成本、精准高效的宫颈癌诊断工具,实现让早期宫颈癌检查在全国社区和基层诊疗体系中全面普及,科技助力宫颈癌早筛早诊高效开展,对我国妇女病防治工作及女性健康管理也具有深远意义。
腾讯天衍实验室在 AI 电子阴道镜辅助诊断系统的研究中提出了新的深度学习框架
近日,腾讯天衍实验室围绕 AI 辅助筛查宫颈癌的研究论文,相继在《BMC Medicine》、《IEEE Transactions On Medical Imaging》、《Medical Image Analysis》及 MICCAI 等多个医学顶级期刊及会议发表和收录。
从技术层面来看,AI 电子阴道镜辅助诊断系统重点突破了医生利用阴道镜诊断宫颈癌与癌前病变时的几大关键难题,包括宫颈病变区域进行精确分割、对不同严重程度 CIN 的精准分离、为阴道镜医师准确定位活检部位提供指导等多项技术瓶颈,显著提升了电子阴道镜诊断效率和准确率。
由于子宫颈表面的光反射等成像条件有一定困难,医师在检查过程中需要准确对病变区域进行分割,为病理检验进行准确的标本取材。但病变区域分割以往比较依赖医生经验,如果医生出现误判,那么病理检验阶段极有可能出现假阴性(指实际有病但检查未发现),假阳性的误诊、漏诊、过度活检等现象的发生,贻误病情。为此,如何提升基层医院阴道镜医师专业能力,精准分割宫颈病变区域等能力,也成为加速消灭宫颈癌待解决的问题之一。
- 提出全局注意机制特征库,辅助阴道镜医师对图像进行多尺度视角进行病变区域分割
在临床实践中,阴道镜医师经常需要放大潜在病变区域,以便更清晰地观察,如图 1(a)和(b)所示。在这些图像中,病变区域大小千差万别,这就对 CAD 系统进行精确地宫颈病变分割提出了多尺度特征提取的高要求。虽然一些解决方案纷纷出台,如 U-Net、PSPNet 和 DeepLab,但仍有改进的空间。
图 1: 宫颈变分割数据集中的示例镜图像。宫颈上皮内瘤变 (CIN) 和宫颈癌的病变区域分别用绿色和蓝色轮廓标注。从左到右:(a)、(b)、(c)、(d)、(e)。
基于此,AI 电子阴道镜辅助诊断系统提出了一种新的全局注意机制,即特征图书馆(feature library)。该机制将整个骨干网络视为一个特征库,收集不同阶段的所有特征,全局性地选择有意义的特征来构成稳健的宫颈病变分割表征,并自适应地选择不同尺度上的特征来重新校准最具信息量的表征,辅助阴道镜医师的临床决策,而且可以为活检部位的定位提供指导。
为了更好地训练和评估该深度学习网络,腾讯天衍实验室构建了一个大规模的宫颈病变分割数据集(CINEMA dataset)。该特征库中的数据集包含了来自近万个病例的数万张图像,宫颈病变可分为宫颈上皮内瘤变(CIN)和癌症,由经验丰富的镜医师对其进行注释。用于深度学习网络的训练和评估。实验结果表明,该特征库对宫颈病变区域具有较好的分割效果。特征库是一个插件式模块,可以很容易地集成到任何 CNN 中。
- 通过融合多时隙图像排查低度鳞状上皮内病变或更严重的病变(LSIL 型,由 CIN1/2/3 和癌症组合)区域,准确识别需要阴道镜活检的患者
醋酸目视检查法 (VIA) 是常用的阴道镜检查方法之一。典型 VIA 的过程可以概括为: 首先,在宫颈上应用 5% 的醋酸,可将发育不良的上皮转变为白色区域(醋白色)。然后,阴道镜医师在 VIA 期间的不同时间点捕获不同数量的醋酸后图像。
宫颈区域在醋酸作用下逐渐变白,并且在施用醋酸 120s 左右变白最为明显。VIA(150 秒)结束后,非癌患者的白色区域可能会消退,而 LSIL 患者将会维持白色区域。白色区域的特征 (白色程度、纹理等) 被视为 LSIL 诊断的一个指标。LSIL 识别的另一个重要临床指标是白色区域的持续时间。
当前,宫颈癌自动诊断系统针对 VIA 实验多采用单时隙图像,即仅使用一幅醋酸阴道镜后的图像进行诊断,宫颈发育不良分类的准确度高度依赖于醋酸后图像的质量,而醋酸后图像对噪声的鲁棒性不强,例如,镊子等伪影可能会遮挡病变区域。此外,使用单一醋酸后图像的框架不能利用 VIA 试验过程中包含的有价值的信息,如白色区域的维持时间。
为此,AI 电子阴道镜辅助诊断系统提出了一种采用延时阴道镜图像来进行 LSIL (包括 CIN 和宫颈癌)识别的深度学习框架,拟用框架包括关键帧特征编码网络和特征融合网络两个部分。该框架首先采用子宫颈检测网络从整个图像中检测出子宫颈区域。然后,利用分离特征编码网络对不同时隙的子宫颈区域进行特征提取(对醋酸试验中大约在第 60、90、120、150 秒捕获的的原始 (醋酸前) 图像和阴道镜图像进行特征编码)。最后,提取的特征通过基于节点和边缘特征的可解释性图卷积网络 (E-GCN) 进行融合,识别出需要活检的患者。
- 基于细粒度病变描述建立阴道镜数据集,提升 CIN 分级准确率
早期发现宫颈上皮内瘤变 (CIN)(可能是宫颈表面鳞状细胞的癌前改变和异常生长)可以明显提高患者存活率。WHO 将 CIN 分为三个等级,CIN1(轻度)、CIN2(中度) 和 CIN3(重度)。不同的 CIN(宫颈上皮内瘤样病变)分级的治疗方法不同。尽管现有的研究提出了计算机辅助诊断 (CAD) 系统用于宫颈癌诊断,但是由于在阴道镜下,CIN1 和 CIN2/3 有很大相似性,但都未能实现精准分离 CIN1 和 CIN2/3。
图 2:GRAND 数据集中的阴道镜图像样本。CIN1 患者 (a) 的图像外观可能与阴道镜下的 CIN2/3 (b)相似。CIN 准确分级存在一些困难,如正常宫颈表面光反射引起的假病变区域 (c) 和伪影引起的闭塞(d)。
AI 电子阴道镜辅助诊断系统中,研究人员构建了一个阴道镜图像数据集(GRAND),用于采用细微病变描述对宫颈上皮内瘤样病变分级。阴道镜专家主要是通过观察 120s 时阴道镜图像上显示的宫颈醋白上皮质地 (TAE) 和血管外观 (ABV) 来进行 CIN 分级。
对于每名患者,研究人员记录下施用醋酸后 120s 的图像,并邀请经验丰富的阴道镜医师对两个临床有用的线索宫颈醋白上皮质地 (TAE) 和血管的外观 (ABV) 进行相应标注,为深度学习网络系统提供了额外信息并提高其 CIN 分级的准确率。
针对该数据集,研究人员建立了一个多评估者介导模型。提出的框架包含有几个通过分别对比学习来利用细微病变特征 TAE 和 ABV 的子网络系统 (评估者),以及一个从阴道镜图像中提取全部信息的骨干网络。对 GRAND 数据集进行了一项综合试验。试验结果证明了使用附加病变描述(TAE 和 ABV) 的获益,可将 CIN 分级准确率提高 10% 以上。此外,通过邀请阴道镜医师与 AI 电子阴道镜辅助诊断系统竞赛,评测出所推出的基准框架的 CIN 分级准确率与阴道镜专家相当。
除此外,由于阴道镜医生在阴道镜检查时会分析图像和非图像信息(子宫颈细胞学检查 TCT 和 HPV 状态),AI 电子阴道镜辅助诊断系统也尽可能准确地模拟阴道镜专家的诊断,该辅助系统由两个基于深度学习的模块组成,分别用于对阴道镜提示的分级和引导活检。简而言之,拟用 AI 电子阴道镜辅助诊断系统首先检测图像的宫颈区域,以便后续特征提取,然后利用图形卷积网络来融合所提取的特征,最后将非图像信息与图像的融合特征连结起来,得出分级提示的结果,预测疑似病变区域,限制引导活检部位的范围。
通过十几万份阴道镜图像的培训和验证,AI 电子阴道镜辅助诊断系统与病理学结果作为黄金标准的一致性达到了 82.2% 的高水平,并且高于阴道镜专家 65.9% 的原始阴道镜解释。上述研究表明,通过 AI 电子阴道镜辅助诊断系统可有效协助基层医院阴道镜师,提升阴道镜师诊疗水准,缩小三级医院与基层医院之间的诊断能力差距,提高宫颈癌筛查质量。
让 AI 下沉基层
尖端技术的突破依赖于与医疗顶级专家合作,但医疗 AI 最广泛的应用场景仍在基层。服务基层医疗机构,助力普惠医疗、服务分级诊疗、推进早癌筛查等也是医疗 AI 的主场景。
AI 电子阴道镜辅诊系统有望为 「两癌筛查」 提供助力,辅助宫颈癌筛查全面落地应用和推广,高效提升宫颈癌筛查服务覆盖人群范围与服务效率,并有效缓解基层医疗服务能力和水平不足的现状,助推卫生资源欠发达地区打通宫颈癌筛查链条的「最后一公里」,让早期宫颈癌检查可以在基层大范围普及,帮助适龄妇女人群,尤其广大农村女性从中获益,最大化释放医疗普惠价值,助推我国医疗资源均衡化发展。
科技改变生活,伴随着互联网、大数据、人工智能等前沿技术的爆发,科技正在推动基层医院数字化升级,改善基层医疗服务质量与水平,帮助患者在基层得到更优质的就医体验以及更精准的诊疗,为改变中国医疗难题发挥科技价值。
附:相关发表论文题目与作者
- 题目:Feature Library: A Benchmark for Cervical Lesion Segmentation
- 作者:Yuexiang Li, Jiawei Chen, Kai Ma, and Yefeng Zheng
- 题目:Computer-Aided Cervical Cancer Diagnosis Using Time-Lapsed Colposcopic Images
- 作者:Yuexiang Li , Jiawei Chen, Peng Xue, Chao Tang, Jia Chang, Chunyan Chu, Kai Ma , Qing Li, Yefeng Zheng, and Youlin Qiao
- 题目:GRAND: A Large-scale Dataset and Benchmark for Cervical Intraepithelial Neoplasia Grading with Fine-grained Lesion Description
- 作者:Yuexiang Li, Zhi-Hua Liu, Peng Xuec , Jiawei Chena , Kai Maa , Tianyi Qiand , Yefeng Zhenga, You-Lin Qiao
- 题目:Development and validation of an artificial intelligence system for grading colposcopic impressions and guiding biopsies
- 作者:Peng Xue, Chao Tang , Qing Li , Yuexiang Li, Yu Shen, Yuqian Zhao, Jiawei Chen, Jianrong Wu, Longyu Li, Wei Wang, Yucong Li, Xiaoli Cui, Shaokai Zhang, Wenhua Zhang, Xun Zhang, Kai Ma, Yefeng Zheng, Tianyi Qian, Man Tat Alexander Ng, Zhihua Liu, Youlin Qiao, Yu Jiang and Fanghui Zhao