采用影像组学的肾肿瘤组织学亚型分类
Classification of renal tumor histology subtypes using radiomics
通讯作者:
收稿日期: 2019-02-22
Received: 2019-02-22
作者简介 About authors
杨熠(1994—),女,硕士生,从事医学影像分析研究.orcid.org/0000-0002-3655-2056.E-mail:
为了在术前更准确、非侵入地鉴别乏脂肪血管平滑肌脂肪瘤(fp-AML)和肾透明细胞癌(ccRCC),提出一种基于CT图像的影像组学模型. 从CT图像中提取774个三维的影像组学特征;分三步进行特征选择:计算皮尔森相关矩阵剔除冗余特征,使用Welch’s t检验确定具有显著差异的特征,利用序列浮动前向选择算法选择具有鉴别能力的特征;使用基于稀疏学习的径向基函数神经网络进行分类. 结果表明:该模型获得的正确率、敏感度、特异性和受试者工作特征曲线下面积分别为90.00%、66.67%、100.0%和0.9173. 利用分类器的输出概率进行模型的可靠性评估,当概率阈值为0.95时,该模型获得的自信正确率、未定率和错分率分别为71.67%、25.00%和3.33%,结果表明所提出的影像组学模型能可靠地对fp-AML和ccRCC进行分类.
关键词:
A CT-based radiomics model was proposed to increase the accuracy of preoperative noninvasive differentiation of fp-AML from ccRCC. There were 774 three-dimensional radiomics features extracted from CT images. The feature selection was carried by three steps: Pearson’s correlation matrices were calculated to remove redundant features; Welch’s t-test was used to determine the statistically significant features; and sequential forward floating selection method was utilized to select the discriminative features. The sparse radial basis function neural network was employed for classification. Results show that the radiomics model yields accuracy, sensitivity, specificity, and the area under the receiver operating characteristic curves of 90.00%, 66.67%, 100.0%, and 0.9173, respectively. The reliability of model was assessed by probabilistic outputs of classifiers. When the probability threshold is 0.95, the model obtains confident classification accuracy, undecided rate, and misclassification rate of 71.67%, 25.00%, and 3.33%, respectively. Results demonstrate that the proposed radiomics model can achieve reliable discrimination of fp-AML from ccRCC.
Keywords:
本文引用格式
杨熠, 钱旭升, 周志勇, 朱建兵, 沈钧康, 戴亚康.
YANG Yi, QIAN Xu-sheng, ZHOU Zhi-yong, ZHU Jian-bing, SHEN Jun-kang, DAI Ya-kang.
据统计,超过90%的肾癌为肾细胞癌(renal cell carcinoma,RCC),全球每年大约有338 000人被诊断为RCC[1-2]. 肾透明细胞癌(clear cell renal cell carcinoma,ccRCC)约占RCC的70%,是RCC最普遍且最致命的亚型,主要的治疗方案为手术切除[1, 3]. 血管平滑肌脂肪瘤(angiomyolipoma,AML)是最常见的良性肾肿瘤,其诊断主要依靠图像中宏观的区域性脂肪,通常不难诊断. 但是部分乏脂肪的AML(fat-poor angiomyolipoma,fp-AML)[4]不含或仅含少量分散的脂肪组织,具有和ccRCC相似的影像学表现,因此极易被误诊[5]. 大部分AML仅需随访而不需要手术治疗[6],然而,Lane等[7]的统计结果显示,高达65%的接受手术治疗的患者最终被病理诊断为fp-AML. 因此,为确保fp-AML患者避免不必要的手术以及ccRCC患者接受正确的治疗,在术前准确地鉴别fp-AML和ccRCC具有重要的意义.
目前,fp-AML和ccRCC的分类研究仍处于初步的探索阶段,主要使用的方法是提取图像的纹理特征后使用机器学习算法进行分类. Feng等[8]提取14个纹理特征后,使用支持向量机(SVM)对17例fp-AML和41例ccRCC进行分类. 该研究先对全部样本进行特征选择,再使用5折交叉验证进行分类性能评估,使得其实验结果过于乐观. Lee等[9]提取64个纹理特征,将3种特征选择算法(序列前向选择、ReliefF和主成分分析)和4种分类器(逻辑回归、k最近邻、随机森林和SVM)两两组合,使用5折交叉验证评估分类器性能以找出最优组合. 在对25例fp-AML和25例ccRCC的分类结果中,ReliefF和k最近邻(k nearest neighbors,kNN)的组合获得了最高的正确率,为72.3%±4.6%. 这些研究由于数据量较小存在过拟合的风险,而所使用的常规分类器无法有效地防止过拟合问题. 此外,现有的研究仅从单张CT切片上提取少量的二维(2D)纹理特征,而少量的特征难以较全面地描述肿瘤的特性,2D特征又无法获取肿瘤的三维空间特性且分类性能高度依赖于所选择的切片[10]. 因此,需要更为有效的方法来推动fp-AML和ccRCC的分类研究.
为解决以上问题,本文将影像组学应用于fp-AML和ccRCC的分类,并提出一种有效的由三维(3D)特征驱动的影像组学模型,以更准确和可靠地对fp-AML和ccRCC进行分类. 首先,从CT图像中提取774个肿瘤的3D影像组学特征. 然后,进行特征选择:1)使用皮尔森相关矩阵(Pearson’s correlation matrices,PCM)剔除冗余特征;2)使用Welch’s t检验确定具有显著差异的特征;3)使用序列浮动前向选择(sequential forward floating selection,SFFS)算法选择具有良好鉴别能力的特征. 最后,使用基于稀疏学习的径向基函数神经网络[16](sparse radial basis function neural network,sRBFNN)进行分类.
1. 研究方法
1.1. 算法流程
首先,由放射科医生手动分割出肿瘤感兴趣区域(region of interest,ROI). 然后,使用影像组学技术从每个ROI中提取774个3D特征. 接着,利用PCM、Welch’s t检验和SFFS算法进行特征选择. 最后,构建sRBFNN分类器完成分类. 本文的算法流程如图1所示.
图 1
1.2. 图像分割
由于肾肿瘤的不规则运动、形状多样,且和正常肾脏的影像学表现相似,准确地自动分割肾肿瘤十分困难. 在日常的临床诊断中,阅片医生在CT图像上对其进行定位较为容易,因此本文的重点研究已经定位的肾肿瘤的诊断判别. 首先,由一名拥有25年临床经验的放射科医生进行肿瘤的定位. 然后,使用一个立方体掩膜在肿瘤区域内提取ROI,选取遵循如下规则:选择最明显和均匀的区域;避开坏死、囊肿、出血和钙化的区域.
图 2
图 2 fp-AML和ccRCC的感兴趣区域(ROI)示例
Fig.2 Examples of region of interest (ROI) of fp-AML and ccRCC
1.3. 特征提取
本文从每个肿瘤ROI中提取774个3D影像组学特征,包括18个一阶统计学特征、68个纹理特征和688个小波特征.
与2D特征相比,本文所提取的3D特征能获取肿瘤的三维空间信息,更全面地描绘肿瘤的特性. 具体地,3D一阶统计学特征同时考虑到了多张切片的灰度值分布. 与角度有关的GLCM和GLRLM在三维空间计算时,增加了9个角度上的纹理信息,如图3所示. 与邻域有关的GLSZM和GLDM从8邻域扩展为三维空间的26邻域,而二维DWT仅能将原始图像分解为LL、LH、HL和HH四种信号.
图 3
图 3 2D和3D特征的计算角度对比
Fig.3 Comparison of computational angles for 2D and 3D features
1.4. 特征选择
作为预处理步骤,首先将特征归一化至[0,1],以避免大数值区间内的特征过分支配小数值区间内的特征[13]. 本文的特征选择算法分三步进行,具体过程如下.
1)使用PCM[21]剔除冗余特征. 计算特征向量中所有特征对的皮尔森相关系数,建立PCM. 通过PCM计算每个特征的平均绝对相关系数,当其大于阈值时,则认为该特征是冗余特征而剔除. 本文实验中将此阈值设定为0.6.
2)使用Welch’s t检验[22]确定具有统计学显著差异的特征. 利用Welch’s t检验计算每个特征在2类数据间的p值,当其小于阈值时,则认为该特征具有显著差异而保留下来. 本文实验中将此阈值设定为0.01.
1.5. 分类算法
为了有效地防止过拟合问题,选用一种新颖的sRBFNN分类器[16]对fp-AML和ccRCC进行分类,其结构由输入层、隐层和输出层构成,图4为一个具有I个输入、K个隐层神经元和2个输出的sRBFNN结构. 其中,
图 4
图 4 基于稀疏学习的径向基函数神经网络(sRBFNN)结构图
Fig.4 Structure chart of sparse radial basis function neural network(sRBFNN)
sRBFNN分类器[16]首先使用改进的最大数据覆盖率(modified maximum data coverage,MMDC)算法确定初始的隐层结构和参数,然后使用定制分象限有限记忆拟牛顿(specialized orthant-wise limited-memory quasi-newton,SOWL-QN)算法同时优化网络的隐层参数和输出权值. 通过引入L1正则化约束,SOWL-QN算法在最小化正则化代价函数的过程中,自动识别并删除冗余的隐层神经元和输出权值,从而很好地防止过拟合问题,提高网络的泛化能力.
2. 实验与结果
2.1. 实验数据集
本文的实验数据为苏州大学附属第二医院提供的60例患者的术前腹部延迟期CT图像,经病理证实,42例为ccRCC,18例为fp-AML. 所有患者的CT图像采集时间与病理诊断时间间隔不超过4周,所使用的成像设备为美国GE多排螺旋CT机. 患者空腹进行膈顶至髂极的扫描,扫描参数如下:管电压120 kV,自动毫安技术,截面厚度5 mm,重建切片厚度1 mm. 此外,医院还提供了放射科医生对这批图像所作的影像学诊断结果.
2.2. 性能评价指标
本文使用2套性能评价指标,第一套为常用的正确率a、敏感度e、特异性s和ROC曲线下面积(area under receiver operating characteristic curve,AUC). 这些指标无法充分提供分类器的决策置信度的信息. 在计算机辅助诊断中,希望计算机所作出的决策是高可信度的,即分类器获得的最大类概率要远大于另一个类概率,否则分类器将不作出决策以减少错误分类. Lukas等[32]在进行多分类时,根据类别数将分类任务划分为多组二分类的形式,使用投票机制完成分类,仅当不少于2/3组给出相同的分类结果时,系统才作出预测,否则系统将不作出决定. Shobeir等[33]为了使分类器所作决策都是高可信度的,设置2个概率阈值α和β(α>β),当分类器的输出概率处于α和β之间时,系统不作出决定,从而实现系统只有正确分类和未定分类2种情况. 类似地,本文设置概率阈值
式中:
式中:
2.3. 实验结果与分析
2.3.1. 不同分类器的分类性能比较
由于使用了留一法交叉验证,特征选择被执行了60次,经过PCM和Welch’s t检验后,留下108~159个3D特征. 使用SFFS算法选择不同的数量特征,各个分类器的正确率如图5所示. 可见,RF、kNN、SVM和sRBFNN分别在特征数为30、40、10和30时获得最高的正确率,此时的分类性能如表1所示. 可以看出,本文所使用的sRBFNN分类器的性能明显优于其他3种常用的分类器. 特别地,sRBFNN获得了100.0%的特异性,这意味着所有的恶性患者均能得到正确的治疗. 虽然RF也获得了同样的特异性,但其敏感度低于sRBFNN,即若采用RF分类器构建的模型,较多的良性患者将接受不必要的手术.
图 5
图 5 基于不同数量3D特征的4种分类器的正确率比较
Fig.5 Accuracy comparison of four classifiers based on different number of selected 3D features
表 1 4种分类器的最优性能比较
Tab.1
分类器 | a/% | e/% | s/% | AUC |
RF | 86.67 | 55.56 | 100.0 | 0.748 0 |
kNN | 86.67 | 61.11 | 97.62 | 0.789 7 |
SVM | 86.67 | 61.11 | 97.62 | 0.672 0 |
sRBFNN | 90.00 | 66.67 | 100.0 | 0.917 3 |
为了进一步评估分类器所作决策的可靠性,将
图 6
2.3.2. 2D和3D特征的鉴别能力比较
图 7
图 7 基于不同数量2D特征的分类器正确率
Fig.7 Accuracy of classifiers based on different numbers of 2D features
表 2 基于2D和3D特征的分类结果对比
Tab.2
评价指标 | a/% | e/% | s/% | AUC |
2D特征 | 83.33 | 66.67 | 90.48 | 0.862 4 |
3D特征 | 90.00 | 66.67 | 100.0 | 0.917 3 |
对由2D和3D特征获得的可靠性评估结果进行对比,如图8所示. 当
图 8
图 8 基于2D和3D特征的模型分类的可靠性对比
Fig.8 Comparison of classification reliability of model based on 2D and 3D features
2.3.3. 本文模型和放射科医生的分类结果比较
为了评估提出模型的有效性,将模型的分类结果与医院提供的放射科医生的影像学诊断结果进行对比,如表3所示. 其中,
表 3 本文模型和放射科医生的分类结果对比
Tab.3
本文模型 | 分类方法 | 放射科医生 | |||
λp = 0.50 | λp = 0.75 | λp = 0.85 | λp = 0.95 | ||
Nc | 48 | 54 | 51 | 45 | 43 |
Nu | 4 | 0 | 3 | 10 | 15 |
Nm | 8 | 6 | 6 | 5 | 2 |
当
图 9
图 9 本文模型和放射科医生误诊的2例fp-AML
Fig.9 Two fp-AML cases misclassified by proposed model and radiologists
3. 结 语
本文提出了一种3D特征驱动的影像组学模型用于准确和无侵入地分类fp-AML和ccRCC. 该模型对图像的3D特征进行提取,实现了更全面的肿瘤特性描绘;结合PCM、Welch’s t检验和SFFS算法进行三步特征选择,实现了更有效的特征选择;使用sRBFNN分类器进行分类,更有效地防止了过拟合问题,提高了模型的泛化能力.
实验证明:1)sRBFNN分类器的分类性能优于其他3种被广泛使用的分类器. 2)使用本文的方法时,3D特征的鉴别能力优于2D特征. 3)提出的影像组学模型能准确可靠地分类fp-AML和ccRCC,能辅助放射科医生非侵入地鉴别fp-AML和ccRCC. 在下一步研究中,将收集更多的数据来进一步验证本文结论,并尝试将所提出的模型推广到其他肾脏疾病的分类中.
参考文献
Renal cell carcinoma
[J].DOI:10.1038/nrdp.2017.9 [本文引用: 2]
Analysis of dual energy spectral CT and pathological grading of clear cell renal cell carcinoma (ccRCC)
[J].DOI:10.1371/journal.pone.0195699 [本文引用: 1]
Angiomyolipoma that do not contain fat attenuation at unenhanced CT
[J].DOI:10.1148/radiol.2341041128 [本文引用: 1]
Benign renal neoplasms in adults: cross-sectional imaging findings
[J].DOI:10.2214/AJR.07.2724 [本文引用: 1]
The radiological diagnosis and treatment of renal angiomyolipoma-current status
[J].DOI:10.1016/j.crad.2009.09.014 [本文引用: 1]
Clinical correlates of renal angiomyolipoma subtypes in 209 patients: classic, fat poor, tuberous sclerosis associated and epithelioid
[J].DOI:10.1016/j.juro.2008.05.041 [本文引用: 1]
Machine learning-based quantitative texture analysis of CT images of small renal masses: differentiation of angiomyolipoma without visible fat from renal cell carcinoma
[J].DOI:10.1007/s00330-017-5118-z [本文引用: 1]
Differentiation of fat-poor angiomyolipoma from clear cell renal cell carcinoma in contrast-enhanced MDCT images using quantitative feature classification
[J].DOI:10.1002/mp.2017.44.issue-7 [本文引用: 1]
Tumour heterogeneity in glioblastoma assessed by MRI texture analysis: a potential marker of survival
[J].DOI:10.1259/bjr.20160242 [本文引用: 1]
Radiomics: the bridge between medical imaging and personalized medicine
[J].DOI:10.1038/nrclinonc.2017.141 [本文引用: 1]
Radiomics of the primary tumour as a tool to improve 18F-FDG-PET sensitivity in detecting nodal metastases in endometrial cancer
[J].DOI:10.1186/s13550-018-0441-1 [本文引用: 1]
Radiomics-based features for pattern recognition of lung cancer histopathology and metastases
[J].DOI:10.1016/j.cmpb.2018.02.015 [本文引用: 1]
Radiomics based detection and characterization of suspicious lesions on full field digital mammograms
[J].DOI:10.1016/j.cmpb.2018.05.017 [本文引用: 1]
Preoperative radiomic signature based on multiparametric magnetic resonance imaging for noninvasive evaluation of biological characteristics in rectal cancer
[J].
Efficient construction of sparse radial basis function neural networks using L1-regularization
[J].DOI:10.1016/j.neunet.2017.07.004 [本文引用: 3]
CT texture analysis: definitions, applications, biologic correlates, and challenges
[J].DOI:10.1148/rg.2017170056 [本文引用: 2]
Decoding tumour phenotype by noninvasive imaging using a quantitative radiomics approach
[J].DOI:10.1038/ncomms5006 [本文引用: 1]
Performance analysis of neural networks for classification of medical images with wavelets as a feature extractor
[J].DOI:10.1002/ima.v25.1 [本文引用: 1]
Note on regression and inheritance in the case of two parents
[J].DOI:10.1098/rspl.1895.0041 [本文引用: 1]
Why Welch’s test is type I error robust
[J].DOI:10.20982/tqmp.12.1.p030 [本文引用: 1]
Using an ensemble classifier based on sequential floating forward selection for financial distress prediction problem
[J].DOI:10.1016/j.jretconser.2016.10.002 [本文引用: 1]
Prediction of menarcheal status of girls using voice features
[J].DOI:10.1016/j.compbiomed.2017.11.005 [本文引用: 2]
Machine learning methods for quantitative radiomic biomarkers
[J].DOI:10.1038/srep13087 [本文引用: 1]
Analysis of K-nearest neighbor technique for breast cancer disease classification
[J].
Computer-aided diagnosis with deep learning architecture: applications to breast lesions in US images and pulmonary nodules in CT scans
[J].DOI:10.1038/srep24454 [本文引用: 1]
Deep feature classification of angiomyolipoma without visible fat and renal cell carcinoma in abdominal contrast-enhanced CT images with texture image patches and hand-crafted feature concatenation
[J].DOI:10.1002/mp.2018.45.issue-4 [本文引用: 1]
Choosing multiple parameters for support vector machines
[J].
Brain tumor classification based on long echo proton MRS signals
[J].DOI:10.1016/j.artmed.2004.01.001 [本文引用: 1]
/
〈 |
|
〉 |
