乳腺炎症需要bi-rads分级(乳腺病变计算机辅助BI-RADS分类的作用)(1)

贾化平 编译,战略支援部队特色医学中心,超声医学科

乳腺影像报告和数据系统词典最早由美国放射学院于2003年提出,目的是将图像的解释和报告标准化、并进行乳腺影像教学,其中包括了超声检查。尽管如此,在BI-RADS超声词典的使用过程中,局灶性乳腺病变的变异性仍然是一个问题。特别是对于一些特征的描述,如边缘和病变回声等。

有证据表明,计算机辅助图像分析可以有效改善放射科医生对局灶性乳腺病变的评估。计算机辅助分类系统的工作分为三个阶段:图像处理、分割和特征提取,可根据每个阶段使用的算法进行分类。据称计算机辅助图像分析可以提高诊断效能,减少对操作者的依赖,改善乳腺病变分类的准确性。意大利学者Bartolotta进行了一项研究,以放射科专家的经验为参考,评估了计算机决策支持这一创新系统的诊断性能,同时评估了操作者引起的变异。

文章发表于La radiologia medica杂志2018年第7期。原文链接:https://www.ncbi.nlm.nih.gov/pubmed/29569216

1 资料和方法

1.1 研究设计

2015年1月至2015年12月,255名连续病例(女252例,男3例;年龄:13-98岁;平均51±14岁),共300个局灶性乳腺病变(大小为2.6-47.2 mm;平均:13.2±7.8 mm )。检查仪器采用三星RS80A高分辨力超声检查仪,探头频率3–12 MHz。

乳房超声指征包括:(1)体检触及肿块;(2)致密型乳腺;(3)辅助乳房X光检查发现病变;(4)乳突痛患者;(5)有家族史的年轻患者或(6)良性乳腺结节或囊肿的随访。排除标准包括缺乏充分的参考指标(如拒绝接受活检或不能连续随访)。没有排除FBL,因为美国成像适用于S-检测评估。

1.2图像分析

S-Detect™是一种内置于RS80A超声系统上的专用软件。将操作者定义的标记放置于通过放置在局灶性乳腺病变上,软件会绘制病变轮廓,并根据BI-RADS超声词典的特征描述,给出可能的良性或恶性分类。超声技师可以接受软件提供的指示,或选择并记录最合适的描述术语,包括最终分类。

S-Detect™应用了一种新的特征提取技术,支持根据BI-RADS超声词典的特征组合对乳房包块进行向量机分类。S-Detect™中用于超声特征分析的指标如下:形状差异、回声和纹理,包块的强度,梯度幅度,方位,纵横比,包块形状与最佳t椭圆的距离、组织与肿块间平均灰度或直方图变化,病变左、后、右侧组织灰度值比较,分叶区域/隆起/凹陷的数目,分叶指数,椭圆归一化周长。

在开始图像分析的前一周,参与这项研究的阅片者必须参加5小时培训课程,所有阅片者必须独立评估并通过S-Detect™评估20例局灶性乳腺病变(包括良性和恶性肿瘤),这些病例不包括在最终研究中。

现场评估:两名资深放射专家(20年以上乳腺超声检查经验)根据共识将300个局灶性乳腺病变分为4类:(1)BI-RADS 2类:良性;(2)BI-RADS 3类:可能良性;(3)BI-RADS 4类:可疑恶性;(4)BI-RADS 5类:高度提示恶性。分类基于2003年版的乳腺超声图谱,使用的超声描述符包括形状、方向、边缘、边界、回声类型和后方回声特征。对超声特征的分析基于第四版的BI-RADS词典。

两名资深放射专家选择每个局灶性乳腺病变最具代表性的图像,在S-Detect™建议的基础上,对每个病变重新分类。对于任何S-Detect™评估后BI-RADS分类有变化的病变,分析引起变化的描述符以及ACR建议的临床管理结果。

离线评估:为了评估观察者内和观察者间的一致性,还有两个独立阅片者(具有四、五年工作经历的放射科住院医师)对同样图像采用S-Detect™完成两次离线评估:分别在基线和3个月后对病变进行随机独立评估,以避免记忆偏倚。有关患者年龄、乳腺癌个人史或家族史信息及以前的超声检查结果可提供给两名阅片者,以更好地复制真实的临床环境以及与共识分析进行有意义的对比。研究中,阅片者不知道病理结果。

参考标准:在本研究中,超声引导穿刺活检是所有S-Detect™评估之前或之后归类为BI-RADS 3、4或5类的局灶性乳腺病变的参考标准。所有病变在S-Detect™评估前后均为BI-RADS 2类的,6、12和24个月时随访评估的结果作为参考标准。特别是在随访期间病变稳定或减小,或是典型良性表现,如囊肿,这些情况要考虑到。

1.3 统计分析

统计分析由生物统计学家使用计算机软件进行。真阳性定义为病变被归类为BI-RADS 4或5类,正确评估为恶性;假阴性定义为病变被归类为BI-RADS 2或3类,并且错误地评估为良性;真阴性定义为病变被归类为BI-RADS 2或3类,并正确评估为良性;假阳性定义为病变被归类为BI-RADS 4或5类,错误评估为恶性。

采用McNemar检验分析应用S-Detect™后诊断能力的改善情况;采用受试者工作特性曲线(ROC)分析应用S-Detect™后的诊断效度;采用卡方检验是分析ROC曲线下面积的平等性。对于所有检验,P<0.05被认为是具有统计学差异。

计算Kappa值,评价观察者内及观察者间的一致性。一致性分级为差(≤0.20),中等(0.20-0.40),一般(0.40–0.60)、良好(0.60–0.80)或非常好(0.80–1.00)。

2 结果

根据参考标准,120/300(40%)局灶性乳腺病变为恶性,2/300(0.7%)局灶性乳腺病变是不确定的病变(导管不典型增生),78/300(59.3%)局灶性乳腺病变为良性(表1)。

图像分析:现场评估

应用S-Detect™后,两名资深放射专家对局灶性乳腺病变特征评估的准确性有所提高,假阴性及假阳性的数量都减少了,但不具有统计意义。ROC曲线参见图1。

乳腺炎症需要bi-rads分级(乳腺病变计算机辅助BI-RADS分类的作用)(2)

图1资深放射专家的受试者工作特征曲线(ROC)。

蓝色线,红色线分别表示放射专家未使用S-Detect™、使用S-Detect™的ROC曲线下面积,对应值分别为0.92(0.90;0.95)和0.95(0.93;0.97)(P值=0.0735),括号内数据为95%可信区间。绿线为参考线。

使用S-Detect™后,两名资深放射专家改变了300个局灶性乳腺病变中的64个(21.3%)的初始BI-RADS分类;在64例重新分类中,正确分类52例(81%)。本研究中,BI-RADS各个分类的病例数量无统计学差异。72个BI-RADS 2类局灶性乳腺病变,应用S-Detect™后均没有被重新分类。最初评估为BI-RADS 3类的84个局灶性乳腺病变,应用S-Detect™后65例仍评估为BI-RADS 3类,且都是正确的,其余19例则因故重新划定了分类(图2,3)

乳腺炎症需要bi-rads分级(乳腺病变计算机辅助BI-RADS分类的作用)(3)

图2 43岁妇女,B型超声发现左侧乳房大小约7毫米的病变(箭头所示)。左图:两位阅片人最初评估为边缘光滑。右图:应用S-Detect™(绿线轮廓),发现边缘有小分叶和部分成角,将病变从BI-RADS 3正确调整为BI-RADS 4b。活检证实病变为浸润性导管癌。

乳腺炎症需要bi-rads分级(乳腺病变计算机辅助BI-RADS分类的作用)(4)

图3 34岁女性中,B型超声显示左侧乳腺9毫米篇低回声病变,呈椭圆形,平行方位(箭头)。左图:起初放射专家评估其边缘部分模糊;右图:应用S-Detect™(绿线轮廓),边缘显示光滑。病变从BI-RADS 4A正确调整为BI-RADS 3,活检证实为小管周围纤维腺瘤。

68个局灶性乳腺病变最初评估为BI-RADS 4类,使用S-Detect™后,43个(63.2%)

被评估为BI-RADS 4类,其中30个(69.8%)分类正确,其余13个错误,后者存在恶性肿瘤特征(图4)。

乳腺炎症需要bi-rads分级(乳腺病变计算机辅助BI-RADS分类的作用)(5)

图4 30岁女性,乳房疼痛,B型超声显示右侧乳房15毫米低回声肿块,呈平行方位(箭头)。左图:两位放射科专家初步判断边缘部分微分叶。右图:应用S-Detect™(绿线轮廓),将边缘界定为光滑。病变错误地从BI-RADS 4A调整为BI-RADS 3,活检证实为粘液癌。

最初评估为BI-RADS 5类的77个局灶性乳腺病变,使用S-Detect™后,57个(74%)被评估为BI-RADS 5类,其中55个评估正确的,2个评估错误(1例黄原肉芽肿,边缘微分叶状,形状不规则;1例纤维化,形状不规则,边缘微分叶,非平行方位)。

即使在使用S-Detect™后,仍有27个(9%)个局灶性乳腺病变不能准确区分其特征。按照出现的频率排序如下:边缘(n=18;P<0.001),形状(n=11;P<0.001),方位(n=7;

P<0.001),后方声学特征(n=3;P>0.05),回声类型(n=2;p>0.05)。

根据S-Detect™重新分类后,64个局灶性乳腺病变中,有27个(42.2%)在临床管理上进行了正确的调整,25个(39.1%)未调整,12个(18.7%)做出了不正确的调整。

图像分析:离线评估。ROC曲线分析显示,两名放射科住院医师在使用S-Detect™后,对300个局灶性乳腺病变的判定准确性明显提高,尽管仍然低于两位资深放射专家(图5)。在使用S-Detect™后,观察者内及观察者间的一致性都得到改善。

乳腺炎症需要bi-rads分级(乳腺病变计算机辅助BI-RADS分类的作用)(6)

图5 蓝色线,红色线分别表示住院医生1(图5a)和住院医生2(图5b)未使用S-Detect™、使用S-Detect™的ROC曲线下面积,住院医生1对应值分别为0.85(0.81;0.89)和0.88(0.84;0.91);住院医生2对应值分别为0.83(0.79;0.87)和0.87(0.83;0.90)。

2 讨论

乳腺超声是一种广泛使用的影像方法,通常作为乳腺X光摄影的辅助手段,目的是表征乳腺局部病变,提高癌症的检出率,减少乳腺癌诊断的假阴性。然而,乳腺超声需要丰富的经验,是一个依赖于操作者的方法,与乳腺X光摄影相比,重复性、特异性及阳性预测值较低。基于超声指标的分类系统,如乳腺影像报告数据系统(BI-RADS),已证实对良性和恶性乳腺病变的描述和分类是有用的。但是,这个系统在确定可疑乳腺病变(BI-RADS 4类)的真实恶性可能方面重复性有限,变异范围为3%到94%,没有改变对侵入性及昂贵诊断方法的选择,如活检。

为了克服这些缺点,图像分析系统已被引入乳腺癌X光摄影筛查,目的是检测病变。然而,在临床实践中,许多癌症损伤不是被忽略,而是被错误解释。因此,乳腺X光摄影已经发展了创新的交互式图像分析方法,旨在帮助放射科医生决策而不是单纯检测病变,显示出与阅片人相当的敏感度。

本研究证实,资深放射专家使用计算机辅助决策支持系统,可以使正确标注的良性及恶性乳腺肿块数量增加。同时,本研究也许是这个系统还达不到预期,不能代替医师的评估。从另一方面说,这个系统可以作为临床参考。S-Detect™辅助评估导致超过五分之一的初始BI-RADS分类发生变化,重新分类的正确率达81%。相应地,64个重新分类的乳腺肿块,近一半的临床管理做了正确调整,主要包括10个初分BI-RADS 3类者调整分类后做了活检,17个初分BI-RADS 4类者调整分类后进行随访,从而避免了不必要的活检。

然而,在本研究中,使用S-Detect™辅助评估后,仍有9%的局灶性乳腺病变没有被准确分类,说明还需要医生的强制性监督。涉及的局灶性乳腺病变主要是良性的,即纤维腺瘤、纤维化和常见的导管增生。虽然这种不正确的升级分类会导致不必要的活检,增加成本和身体不适,但从临床角度看,没有增加漏诊恶性肿瘤的风险。另一方面,本研究中的120个恶性局灶性乳腺病变,资深放射专家使用S-Detect™辅助评估后,只有两个(1.2%)被错误地解释为"可能良性"。这两例的组织学诊断分别为浸润性粘液癌和恶性叶状瘤,它们都是非常罕见的乳腺肿瘤,表现了一些良性征象,比如"卵圆形"和"边缘光滑"。本研究中,有一例不典型的导管增生,最初被两个专家漏诊,使用S-Detect™辅助评估后,准确识别为可疑;另有一例不典型的导管增生,由于呈卵圆形且边缘光滑,被错误地降级分类为BI-RADS 3类。

在本研究中,误导分类的三个主要超声描述符按出现频率分别为边缘、形状和方位。两名放射科住院医师在使用S-Detect™后,对局灶性乳腺病变的判定准确性明显提高,观察者内及观察者间的一致性都得到改善。这可能是因为图像分析系统呈现了更多的超声图像特征,引起了住院医师的注意,也更有力地表明需要进行培训统一规范BI-RADS词典。

本研究有一些局限性。首先,对超声特征的分析是基于第四版BI-RADS,虽然第四版和第五版的超声BI-RADS变化很小,但仍需要进一步研究。第二,本研究没有对每个超声描述符的类型进行特别分析,需要进一步研究图像分析系统利用此类超声特征进行评估的附加值。BI-RADS分类包括了乳腺病变的血流评估,但没有强制使用彩色多普勒超声进行分类,因此可能有帮助的多普勒分析,并未包括在本研究内。第三,本研究是单一机构的研究,研究序列不一定能反映一般人群的乳腺癌筛查情况。此外,阅片者的经验也不能准确量化,因此需要进一步研究来评估该软件的作用。

总之,本研究表明,S-Detect™可以用作局灶性乳腺病变BI-RADS分类有效的计算机辅助决策工具,至少可以提高经验不足的医生对乳腺癌的检出率,同时,应当强制实施专家的监督。

,