分享

ACR-TIRADS 对甲状腺结节鉴别诊断的效能评估

 压下影响力基本 2019-01-31

文章来源:中华超声影像学杂志 

2018,27(6): 505-509.

作者:张于芝 徐婷 顾经宇 叶新华 徐书杭 吴阳 邵新宇 刘德珍 陆卫平 华飞 施毕旻 梁军 许岚 唐伟 刘超 武晓泓


引 言



超声检查是目前评估甲状腺结节的首选方法,由于恶性结节超声特征复杂多样,依据某一特征预测恶性结节并不可靠  [1-2] 。2009 年 Horvath 等  [3]  首次建立了甲状腺影像报告和数据系统 (Thyroid Imaging Reporting and Data System,TIRADS),规范了甲状腺结节的超声诊断报告。此后,不同地区的研究者陆续提出了多种超声风险分层系统,提高了对甲状腺结节的鉴别诊断能力  [4-9] 。

 

美国放射学会 (American College of Radiology,ACR) 于 2017 年发布的《甲状腺影像-报告和数据系统 (TI-RADS):ACR-TIRADS 委员会白皮书》同样提出了一种风险分层方法 (下称 ACR-TIRADS) [4] 。然而目前尚缺乏对 ACR-TIRADS 在甲状腺结节中鉴别诊断效能的验证。

 

本研究旨在评估 ACR-TIRADS 对甲状腺恶性结节的诊断价值,并与 2011 年韩国的 Kwak 等  [5]  提出的 TIRADS (下称 K-TIRADS)、2015 年美国甲状腺学会 (American Thyroid Association,ATA) 提出的恶性风险分层系统 (下称 ATA 风险分层) 比较,为临床运用的选择提供依据。



资料与方法


1、研究对象


本研究为回顾性研究,数据来自于甲状腺结节临床评估及管理 (TEAM) 项目。收集 2014 年 1 月至 2015 年 12 月于江苏南京、常州、苏州、无锡、淮安、徐州 8 家三级医院内分泌科门诊行甲状腺细针穿刺活检 (fine-needle aspiration biopsy,FNAB) 或甲状腺外科住院行手术切除的 2,356 例甲状腺结节患者 (共 2,549 个结节) 资料。

 

纳入标准:

①甲状腺超声图像资料齐全;

②接受手术治疗且有详细术后病理资料;

③未行手术治疗者有详细 Bethesda 甲状腺细胞病理报告系统 (the Bethesda system for reporting thyroid cytopathology,BSRTC) 诊断结果。

 

排除标准:

①FNAB 不能明确性质 (BSRTC Ⅰ、Ⅲ、Ⅳ、Ⅴ类) 且未行手术治疗的结节;

②BSRTC Ⅱ类结节未行随访,或随访时间<12 个月者;

③BSRTC Ⅱ类结节超声随访过程中出现新的恶性超声征象或体积明显增大者 (体积明显增大定义为实性结节或囊实混合性结节的实性部分体积增加 50%,或至少有两个径线增加 20%、每个径线至少增加 2 mm)。

 

最终共 1,760 例患者 (1,912 个结节) 纳入本研究,其中男性 362 例,女 1,398 例,年龄 6~89 岁,平均 (47.98±13.44) 岁。恶性结节共 786 个,均由术后病理证实;良性结节共 1,126 个,其中手术确诊 426 个,另 700 个结节 FNAB 结果为 BSRTCⅡ类,且超声随访未见明显增大及性质改变,视为良性。本研究经南京中医药大学附属中西医结合医院伦理委员会审批通过 (2012-SR-058)。


2、研究方法


各中心按照 TEAM 项目制定的统一超声检查操作规范和描述指标,由超声医师进行标准化超声检查,再由一位高年资超声医师回顾超声图像及报告,将入选病例的超声特征录入数据库。

 

超声指标包括结节数目 (单发、多发)、大小 (上下径、前后径、左右径)、部位 (左叶、右叶、峡部)、纵横比 (≥ 1、<1)、形态 (规则、不规则)、边界 (光整、模糊、分叶、毛刺)、内部回声 (高回声、等回声、低回声、极低回声、无回声)、内部结构 (实性、混合性、囊性、海绵状)、钙化 (微小钙化、粗大钙化、蛋壳样钙化、无钙化)、声晕 (厚薄不均声晕、均匀声晕、无声晕)、后方回声 (衰减、增强或无变化)、腺体外侵犯情况 (甲状腺包膜完整、肿瘤突破包膜) 及血流 (内部血流为主、周围血流为主、无明显血流或周围少许血流)。

 

最终数据汇总后由一位超声医师根据数据库录入的超声特征,分别按照 ACR-TIRADS、K-TIRADS 和 ATA 风险分层标准将结节分为 ACR-TIRADS 1/2/3/4/5 类、K-TIRADS 3/4a/4b/4c/5 类、以及良性/极低度可疑/低度可疑/中度可疑/高度可疑恶性 (图 1)。


图1  甲状腺结节声像图 

 

A:基本纯囊性结节,ACR-TIRADS1/K-TIRADS3/极低度可疑恶性;

B:混合性等回声结节,ACR-TIRADS2/KTIRADS3/极低度可疑恶性;

C:基本纯实性等回声结节,ACR-TIRADS3/K-TIRADS4a/低度可疑恶性;

D:实性低回声结节,ACR-TIRADS4/K-TIRADS4b/中度可疑恶性;

E:实性低回声结节,纵横比>1,ACR-TIRADS5/K-TIRADS4c/高度可疑恶性;

F:实性稍低回声结节,边缘分叶,内部可见点状强回声,ACR-TIRADS5/K-TIRADS4c/高度可疑恶性。

3、统计学分析


采用 SPSS 20.0 统计软件分析数据。连续变量以中位数 (四分位数) 表示,分类变量以率或比描述。两样本连续变量的比较采用 t 检验或 Mann-Whitney 检验,分类数据的比较采用χ 2  或 Fisher 精确概率法检验。采用 MedCalc 11.4.2.0 统计软件,以 FNAB 随访结果、术后病理为参照,构建 ROC 曲线评价并比较不同风险分层系统诊断效率。以 P < 0.05 为差异有统计学意义。


结 果


1、临床特点


本研究共入选 1,760 例患者,1,912 个结节,其中良性 1,126 个,恶性 786 个。研究人群的一般临床特征及结节的超声特征见表 1。单发结节恶性率显著高于多发结节 (P <0.001),恶性患者的年龄、结节直径大小显著低于良性患者 (P <0.001),而结节不同位置间的良恶性差异无统计学意义 (P = 0.278)。

 

表 1   研究人群及结节的临床特征


2、ACR-TIRADS 及 K-TIRADS、ATA 风险分层与诊断结果对照


根据 ACR-TIRADS,所有 1,912 个结节分别归类于 ACR-TIRADS 1~5 类中,各类别中恶性率分别为 1.9%、3.7%、21.2%、50.5%、90.7% (表 2)。根据 K-TIRADS,所有结节被归类至 K-TIRADS 3~5 类,各类别中恶性比例分别为 6.6%、16.4%、52.7%、87.7%、97.7% (表 2)。根据 ATA 风险分层,1,803 个 (94.3%) 结节分别归类于极低度可疑恶性、低度可疑恶性、中度可疑恶性及高度可疑恶性 4 类中,各分层中恶性率依次为 0、4.7%、26.3%、77.3% (表 2)。另外 109 个 (5.7%) 结节无法依据 ATA 风险分层归类,其中恶性率达 31.2% (34/109)。

 

表 2   ACR-TIRADS、K-TIRADS 及 ATA 风险分层与诊断结果对照


3、ACR-TIRADS的诊断效能及其与K-TIRADS、ATA 风险分层的比较


根据 ROC 曲线分析,可得出各超声风险分层系统的最佳诊断点、曲线下面积 (AUC)、敏感性、特异性、阳性预测值及阴性预测值 (表 3)。三种系统两两之间 AUC 比较差异均有统计学意义 (P <0.05),其中 K-TIRADS 最高 (0.866),而 ACR-TIRADS 最低 (0.830)。ACR-TIRADS 及 K-TIRADS 敏感性差异无统计学意义 (86.9% 对 84.9%,P = 0.137),但均显著高于 ATA 风险分层 (79.4%,P <0.001)。三种系统两两之间特异性比较差异均具有统计学意义 (P <0.001),其中 ATA 风险分层最高 (83.4%) 而 ACR-TIRADS 最低 (64.1%)(表 3)。

 

表 3   三种超声风险分层系统的诊断效能


讨 论


本研究在中国人群中评价 ACR-TIRADS 的鉴别诊断效能,并将其与 K-TIRADS、ATA 风险分层系统基于同一数据库进行比较研究。结果显示以上 3 种甲状腺结节超声风险分层系统均具有良好的诊断价值,其中,K-TIRADS 的 AUC 最大,诊断效能最佳。ACR-TIRADS 具有最高的敏感性及较高的阴性预测价值,而 ATA 风险分层具有最高的特异性及阳性预测价值。

 

美国放射学会于 2017 年发布 ACR 版 TIRADS  [4] ,规范了甲状腺结节超声报告,并对 FNAB 的指征作了详细阐述。ACR-TIRADS 对 5 种超声特征 (内部结构、回声、纵横比、边界、强回声点) 的不同表现逐一赋分,计算每个结节的总分值并据此进行分级。他们在一个包含 3,000 多例结节的数据库中验证了其风险预测效能,部分结果显示,在 ACR-TIRADS 1 和 ACR-TIRADS 2 类结节中恶性风险 ≤ 2%,在 ACR-TIRADS 3、4、5 类结节中恶性风险分别为 5%、5%~20%、≥ 20%  [4,10] 。

 

本研究中 ACR-TIRADS 3、4 类结节实际恶性比例 (21.2%、50.5%) 明显高于 ACR 的验证结果,这可能与本研究入选人群总体恶性比例较高有关。在甲状腺良恶性结节鉴别诊断中,ACR-TIRADS 的敏感性较高 (86.9%), 而特异性低 (64.1%), 其 AUC 达 0.830,总体诊断价值良好。

 

Kwak 等  [5]  建立的 K-TIRADS 同样采用类似评分的方法,根据结节所具有的恶性超声征象 (实性、极低/低回声、不规则边界/微小分叶、微钙化、纵横比>1) 的个数进行分层。本研究中 K-TIRADS 3~4b 类的实际恶性比例均高于推荐范围 (3 类:2% ~ 2.8%;4a:3.6% ~ 12.7%;4b:6.8%~37.8%),其原因除本研究人群恶性率较高之外,还可能与结节大小构成不同有关。K-TIRADS 是基于直径 ≥ 1 cm 的结节制定的,而本研究尚包含直径<1 cm 的结节。与 ACR-TIRADS 相比,K-TIRADS 仅以恶性征象的个数进行分层,忽略了每种征象预测价值的差异,但同时也更简单、易于应用。本研究人群中 K-TIRADS 除敏感性稍低外,特异性及 AUC 均显著高于 ACR-TIRADS,整体鉴别诊断价值较高。

 

2015 年 ATA  [6]  提出的超声恶性风险分层,基于内部结构、回声、边缘、钙化、纵横比、甲状腺被膜受侵情况等构成的图像模型对甲状腺结节分类。本研究中各层次实际恶性率与推荐范围相差不大。但值得注意的是另有 109 个 (5.7%) 结节无法确切归类,其中恶性率高达 31.2%,与中度可疑恶性的恶性率 (10%~20%) 相近。Yoon 等  [11] 、徐婷等  [12]  也发现部分结节 (3.4%、6.4%) 无法归类于 ATA 分层,其中恶性比例达 18.2%、31.5%。

 

本研究中无法归类结节主要为实性等/高回声伴有其他 1 个或多个可疑恶性特征,而 ATA 风险分层中的高/中度可疑恶性超声模型仅包含实性低回声 (或囊实性结节中实性成分为低回声) 结节。而在 Horvath 提出的 TIRADS 中,当等回声无包膜结节伴微小钙化时,其分级可达 TIRADS 4b。另外 Seo 等  [7]  发现实性等/高回声结节伴有钙化时,其恶性风险为 24.7%。由此可见 ATA 风险分层高估了低回声这一特征的阴性预测价值,临床应用中对于等/高回声伴其他恶性征象的结节仍不可忽视。

 

与 ACR-TIRADS、K-TIRADS 不同的是,ATA 依赖图像模式对结节分类,较评分法更为复杂,且不能涵盖所有结节,对其临床应用有一定的限制性。而评分法则较为简单,适用于所有甲状腺结节,且可减小观察者之间的差异,利于不同医疗中心间检查结果的比较。本研究人群中,ATA 风险分层的 AUC (0.852) 介于 ACR-TIRADS 与 K-TIRADS 之间, 特异性最高 (83.4%),但敏感性最低 (79.4%)。

 

综上所述, 本地区多中心大样本研究发现,ACR-TIRADS 整体诊断效率良好, 但低于 K-TIRADS 及 ATA 风险分层。在 3 种风险分层系统中,ACR-TIRADS 具有最高的敏感性,ATA 风险分层具有最高的特异性及阳性预测价值,而 K-TIRADS 整体诊断效能最佳。另外尚有部分结节无法归类于 ATA 分层系统,其中的高恶性率不容忽视。超声的高特异性可降低假阳性率,减少过度诊疗,减少不必要的 FNAB,但作为筛选高危结节进行 FNAB 检查的工具,其高敏感性又非常重要,故在实际临床应用中需综合考量,选择最适合的风险评估方法。

 

局限性:

①由于本研究为多中心回顾性研究,各中心检查医师之间存在差异,且回顾超声资料时可能会受超声诊断的影响而造成偏倚。然而本项目团队对超声检查及描述制定了统一规范,且各中心由专人负责重新回顾超声图像及报告,可在一定程度上降低这种差异对结果的影响;

 

②入选人群中甲状腺结节恶性比例较高,存在选择偏倚;

 

③部分最终诊断为良性的结节仅根据细胞学及随访结果判断,不能排除假阴性结果;

 

④不同风险分层系统对超声特征的定义略有差异,在分级时可能会导致一定偏差。

 

因此,ACR-TIRADS 在甲状腺结节鉴别诊断的价值评估仍需在未来前瞻性研究中做进一步验证。


参 考 文 献

[1] American Thyroid Association(ATA)Guidelines Taskforce on Thyroid Nodules and Differentiated Thyroid Cancer, Cooper DS, Doherty GM, et al .Revised American Thyroid Association management guidelines for patients with thyroid nodules and differentiated thyroid cancer [J ].Thyroid, 2009,19(11): 1167-1214. DOI:10. 1089/thy.2009.0110.

[2]Wolinski K, Szkudlarek M, Szczepanek-Parulska E, et al. Usefulness of different ultrasound features of malignancy in predicting the type of thyroid lesions a meta-analysis of prospective studies [J]. Pol Arch Med Wewn, 2014,124(3): 97-104 DOI:10.20452/pamw.2132.

[3]Horvath E, Majlis S, Rossi R, et al. An ultrasonogram reporting  system for thyroid nodules stratifying cancer risk for clinical management [J]. J Clin Endocrinol Metab, 2009, 94(5): 1748-1751. DOI:10.1210/jc. 2008-1724.

[4]Tessler FN, Middleton WD, Grant EG, et al. ACR thyroid imaging reporting and data system (TI-RADS) white paper of the ACR TI-RADS committee [J] J Am Coll Radiol, 2017, 14 (5): 587-595. DOI: 10. 1016/j.jacr,2017. 01. 046

[5]Kwak JY, Han KH, Yoon JH, et al, Thyroid imaging reporting and data system for US features of nodules: a step in establishing better stratification of cancer risk [J]. Radiology, 2011, 260 (3) 892-899. DOI:10. 1148/radiol. 11110206.

[6] Haugen BR Alexander EK Bible KC et al. 2015 American Thyroid Association management guidelines for adult patients with thyroid nodules and differentiated thyroid cancer: the American Thyroid Association guidelines task force on thyroid nodules and differentiated thyroid cancer [J]. Thyroid, 2016, 26 (1): 1-133. DOI: 10. 1089/thy. 2015.0020.

[7] Seo H, Na DG, Kim JH, et al. Ultrasound-based risk stratification for malignancy in thyroid nodules: a four-tier categorization system [J]. Eur Radiol, 2015,25 (7): 2153-2162. DOI: 10. 1007/s00330-015-3621-7.

[8]Shin JH,Baek JH,Chung J,et al. Ultrasonography diagnosis and imaging-based management of thyroid nodules: revised Korean Society of Thyroid Radiology consensus statement and recommendations J Korean J Radiol, 2016 17 (3): 370-395. DOI: 10. 3348/kjr. 2016. 17. 3. 370.

[9] 刘娟, 詹维伟, 董屹婕. 超声在甲状腺癌术前的评估价值 [J]. 中华超声影像学杂志, 2017, 26(3): 273-275. DOI: 10. 3760/ cma. J.issn. 1004-4477.2017. 03.012.

[10]Middleton WD. Teefey SA, Reading CC, et al. Multiinstitutional analysis of thyroid nodule risk stratification using the american  college of radiology thyroid imaging reporting and data system[J]. Am J Roentgenol, 2017, 208(6): 1331-1341.DOI:10. 2214/AJR.16.17613.

[11]Yoon JH, Lee HS, Kim EK, et al. Malignancy risk stratification  of thyroid nodules comparison between the Thyroid Imaging Reporting and Data System and the2014 American Thyroid Association Management Guidelines [J]. Radiology, 2015,278(3): 917-924.DOI:10. 1148/radiol.2015150056.

[12] 徐婷, 顾经宇, 叶新华, 等. TIRADS 与 2015 年美国甲状腺学会指南超声模式对甲状腺结节良恶性鉴别诊断效能的对比研 [J]. 中华内分泌代谢杂志,2016,32(12): 999-1002. DO:10. 3760/cma.j.issn.1000-6699.2016.12.005.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多