浙江大学学报(工学版), 2019, 53(12): 2381-2388 doi: 10.3785/j.issn.1008-973X.2019.12.016

计算机科学与人工智能

采用影像组学的肾肿瘤组织学亚型分类

杨熠,, 钱旭升, 周志勇, 朱建兵, 沈钧康, 戴亚康,

Classification of renal tumor histology subtypes using radiomics

YANG Yi,, QIAN Xu-sheng, ZHOU Zhi-yong, ZHU Jian-bing, SHEN Jun-kang, DAI Ya-kang,

通讯作者: 戴亚康,男,研究员. orcid.org/0000-0003-3357-1638. E-mail: daiyk@sibet.ac.cn

收稿日期: 2019-02-22  

Received: 2019-02-22  

作者简介 About authors

杨熠(1994—),女,硕士生,从事医学影像分析研究.orcid.org/0000-0002-3655-2056.E-mail:yangyi129@icloud.com , E-mail:yangyi129@icloud.com

摘要

为了在术前更准确、非侵入地鉴别乏脂肪血管平滑肌脂肪瘤(fp-AML)和肾透明细胞癌(ccRCC),提出一种基于CT图像的影像组学模型. 从CT图像中提取774个三维的影像组学特征;分三步进行特征选择:计算皮尔森相关矩阵剔除冗余特征,使用Welch’s t检验确定具有显著差异的特征,利用序列浮动前向选择算法选择具有鉴别能力的特征;使用基于稀疏学习的径向基函数神经网络进行分类. 结果表明:该模型获得的正确率、敏感度、特异性和受试者工作特征曲线下面积分别为90.00%、66.67%、100.0%和0.9173. 利用分类器的输出概率进行模型的可靠性评估,当概率阈值为0.95时,该模型获得的自信正确率、未定率和错分率分别为71.67%、25.00%和3.33%,结果表明所提出的影像组学模型能可靠地对fp-AML和ccRCC进行分类.

关键词: 计算机辅助诊断 ; 乏脂肪血管平滑肌脂肪瘤 ; 肾透明细胞癌 ; 影像组学 ; 径向基函数神经网络

Abstract

A CT-based radiomics model was proposed to increase the accuracy of preoperative noninvasive differentiation of fp-AML from ccRCC. There were 774 three-dimensional radiomics features extracted from CT images. The feature selection was carried by three steps: Pearson’s correlation matrices were calculated to remove redundant features; Welch’s t-test was used to determine the statistically significant features; and sequential forward floating selection method was utilized to select the discriminative features. The sparse radial basis function neural network was employed for classification. Results show that the radiomics model yields accuracy, sensitivity, specificity, and the area under the receiver operating characteristic curves of 90.00%, 66.67%, 100.0%, and 0.9173, respectively. The reliability of model was assessed by probabilistic outputs of classifiers. When the probability threshold is 0.95, the model obtains confident classification accuracy, undecided rate, and misclassification rate of 71.67%, 25.00%, and 3.33%, respectively. Results demonstrate that the proposed radiomics model can achieve reliable discrimination of fp-AML from ccRCC.

Keywords: computer-aided diagnosis ; fat-poor angiomyolipoma ; clear cell renal cell carcinoma ; radiomics ; radial basis function neural network

PDF (1356KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

杨熠, 钱旭升, 周志勇, 朱建兵, 沈钧康, 戴亚康. 采用影像组学的肾肿瘤组织学亚型分类. 浙江大学学报(工学版)[J], 2019, 53(12): 2381-2388 doi:10.3785/j.issn.1008-973X.2019.12.016

YANG Yi, QIAN Xu-sheng, ZHOU Zhi-yong, ZHU Jian-bing, SHEN Jun-kang, DAI Ya-kang. Classification of renal tumor histology subtypes using radiomics. Journal of Zhejiang University(Engineering Science)[J], 2019, 53(12): 2381-2388 doi:10.3785/j.issn.1008-973X.2019.12.016

据统计,超过90%的肾癌为肾细胞癌(renal cell carcinoma,RCC),全球每年大约有338 000人被诊断为RCC[1-2]. 肾透明细胞癌(clear cell renal cell carcinoma,ccRCC)约占RCC的70%,是RCC最普遍且最致命的亚型,主要的治疗方案为手术切除[1, 3]. 血管平滑肌脂肪瘤(angiomyolipoma,AML)是最常见的良性肾肿瘤,其诊断主要依靠图像中宏观的区域性脂肪,通常不难诊断. 但是部分乏脂肪的AML(fat-poor angiomyolipoma,fp-AML)[4]不含或仅含少量分散的脂肪组织,具有和ccRCC相似的影像学表现,因此极易被误诊[5]. 大部分AML仅需随访而不需要手术治疗[6],然而,Lane等[7]的统计结果显示,高达65%的接受手术治疗的患者最终被病理诊断为fp-AML. 因此,为确保fp-AML患者避免不必要的手术以及ccRCC患者接受正确的治疗,在术前准确地鉴别fp-AML和ccRCC具有重要的意义.

目前,fp-AML和ccRCC的分类研究仍处于初步的探索阶段,主要使用的方法是提取图像的纹理特征后使用机器学习算法进行分类. Feng等[8]提取14个纹理特征后,使用支持向量机(SVM)对17例fp-AML和41例ccRCC进行分类. 该研究先对全部样本进行特征选择,再使用5折交叉验证进行分类性能评估,使得其实验结果过于乐观. Lee等[9]提取64个纹理特征,将3种特征选择算法(序列前向选择、ReliefF和主成分分析)和4种分类器(逻辑回归、k最近邻、随机森林和SVM)两两组合,使用5折交叉验证评估分类器性能以找出最优组合. 在对25例fp-AML和25例ccRCC的分类结果中,ReliefF和k最近邻(k nearest neighbors,kNN)的组合获得了最高的正确率,为72.3%±4.6%. 这些研究由于数据量较小存在过拟合的风险,而所使用的常规分类器无法有效地防止过拟合问题. 此外,现有的研究仅从单张CT切片上提取少量的二维(2D)纹理特征,而少量的特征难以较全面地描述肿瘤的特性,2D特征又无法获取肿瘤的三维空间特性且分类性能高度依赖于所选择的切片[10]. 因此,需要更为有效的方法来推动fp-AML和ccRCC的分类研究.

影像组学是医学影像分析领域的新兴方法,其本质是从医学影像中高通量地提取定量的特征用于描述组织的特性以提高诊断和预测的准确率[11]. 已有研究证实,影像组学与机器学习方法相结合所构建的影像组学模型可以大大提高非侵入性诊断的准确率,对临床决策具有指导意义[12-15]. 但是,目前仍未有研究将其应用于fp-AML和ccRCC的分类中.

为解决以上问题,本文将影像组学应用于fp-AML和ccRCC的分类,并提出一种有效的由三维(3D)特征驱动的影像组学模型,以更准确和可靠地对fp-AML和ccRCC进行分类. 首先,从CT图像中提取774个肿瘤的3D影像组学特征. 然后,进行特征选择:1)使用皮尔森相关矩阵(Pearson’s correlation matrices,PCM)剔除冗余特征;2)使用Welch’s t检验确定具有显著差异的特征;3)使用序列浮动前向选择(sequential forward floating selection,SFFS)算法选择具有良好鉴别能力的特征. 最后,使用基于稀疏学习的径向基函数神经网络[16](sparse radial basis function neural network,sRBFNN)进行分类.

1. 研究方法

1.1. 算法流程

首先,由放射科医生手动分割出肿瘤感兴趣区域(region of interest,ROI). 然后,使用影像组学技术从每个ROI中提取774个3D特征. 接着,利用PCM、Welch’s t检验和SFFS算法进行特征选择. 最后,构建sRBFNN分类器完成分类. 本文的算法流程如图1所示.

图 1

图 1   影像组学模型的算法流程图

Fig.1   Algorithm flowchart of proposed radiomics model


1.2. 图像分割

由于肾肿瘤的不规则运动、形状多样,且和正常肾脏的影像学表现相似,准确地自动分割肾肿瘤十分困难. 在日常的临床诊断中,阅片医生在CT图像上对其进行定位较为容易,因此本文的重点研究已经定位的肾肿瘤的诊断判别. 首先,由一名拥有25年临床经验的放射科医生进行肿瘤的定位. 然后,使用一个立方体掩膜在肿瘤区域内提取ROI,选取遵循如下规则:选择最明显和均匀的区域;避开坏死、囊肿、出血和钙化的区域.

对实验数据中肿瘤的大小进行统计,fp-AML患者的肿瘤尺寸范围为1.49~9.30 cm,ccRCC患者的肿瘤尺寸范围为1.50~9.25 cm,不同患者的肿瘤大小差异较大. 由于大肿瘤的组织成分比较复杂,肿瘤区域内常常伴随有坏死、囊肿、出血和钙化,同时为了减少手动分割的工作量和算法的计算量,本文将立方体掩膜的最大尺寸设定为23×23×10(像素),此时能覆盖实验数据中70%样本的肿瘤. ROI示例如图2所示,是fp-AML,tu 2(c)(d)是ccRCC.

图 2

图 2   fp-AML和ccRCC的感兴趣区域(ROI)示例

Fig.2   Examples of region of interest (ROI) of fp-AML and ccRCC


1.3. 特征提取

本文从每个肿瘤ROI中提取774个3D影像组学特征,包括18个一阶统计学特征、68个纹理特征和688个小波特征.

一阶统计学特征能不考虑空间关系地描述图像的灰度值分布[17]. 本文提取能量、熵、最大值、最小值、均值、中位数、方差、偏度和峰度等,共计18个一阶统计学特征[18].

纹理特征通过分析图像中像素灰度值的分布和关系提供对肿瘤异质性的客观和定量的评估[17]. 本文使用灰度共生矩阵(gray-level co-occurrence matrix,GLCM)、灰度游程矩阵(gray-level run-length matrix,GLRLM)、灰度区域大小矩阵(gray-level size zone matrix,GLSZM)和灰度依赖矩阵(gray-level dependence matrix,GLDM)特征提取算法提取纹理特征,共提取22个GLCM特征、16个GLRLM特征、16个GLSZM特征和14个GLDM特征[18].

三维离散小波变换(discrete wavelet transform,DWT)可将原始图像分解为LLL、LLH、LHL、HLL、HHH、HHL、HLH和LHH八种信号[19]. 从每一种信号中提取上述的一阶统计学特征和纹理特征,共计提取688个小波特征. 本文选用db4小波,是因其在医学图像分类上的良好表现[20].

与2D特征相比,本文所提取的3D特征能获取肿瘤的三维空间信息,更全面地描绘肿瘤的特性. 具体地,3D一阶统计学特征同时考虑到了多张切片的灰度值分布. 与角度有关的GLCM和GLRLM在三维空间计算时,增加了9个角度上的纹理信息,如图3所示. 与邻域有关的GLSZM和GLDM从8邻域扩展为三维空间的26邻域,而二维DWT仅能将原始图像分解为LL、LH、HL和HH四种信号.

图 3

图 3   2D和3D特征的计算角度对比

Fig.3   Comparison of computational angles for 2D and 3D features


1.4. 特征选择

作为预处理步骤,首先将特征归一化至[0,1],以避免大数值区间内的特征过分支配小数值区间内的特征[13]. 本文的特征选择算法分三步进行,具体过程如下.

1)使用PCM[21]剔除冗余特征. 计算特征向量中所有特征对的皮尔森相关系数,建立PCM. 通过PCM计算每个特征的平均绝对相关系数,当其大于阈值时,则认为该特征是冗余特征而剔除. 本文实验中将此阈值设定为0.6.

2)使用Welch’s t检验[22]确定具有统计学显著差异的特征. 利用Welch’s t检验计算每个特征在2类数据间的p值,当其小于阈值时,则认为该特征具有显著差异而保留下来. 本文实验中将此阈值设定为0.01.

3)使用SFFS算法[23]选择具有良好鉴别能力的特征. SFFS算法能降低陷入局部最优的可能,并提高分类的准确率[24]. 该算法选择的特征子集 $x$从空集开始,每轮在未选择的特征中选择一个特征加入,使得加入后的 $x$能获得最优的评价指标,然后在 $x$中选择一个特征剔除,使得剔除后的 $x$能获得高于剔除前的最优评价指标,循环直至 $x$中的特征个数等于指定的特征数量N. 本文实验中的评价指标为由线性判别分析[25]获得的分类正确率,将N设定为10、20、30、40、50和60.

1.5. 分类算法

为了有效地防止过拟合问题,选用一种新颖的sRBFNN分类器[16]对fp-AML和ccRCC进行分类,其结构由输入层、隐层和输出层构成,图4为一个具有I个输入、K个隐层神经元和2个输出的sRBFNN结构. 其中, ${{ x}_j} = {[{x_{1j}},{x_{2j}},\cdots,{x_{Ij}}]^{\rm{T}}}$表示网络的第j个输入样本,为 $j = 1,2,\cdots,J,\;J$表示输入样本的总数. ${{ \varphi} _k} = [\varphi ({{ x}_1},{{ c}_k}),\varphi ({{ x}_2},{{ c}_k}),\cdots,$ $ \varphi ({{ x}_J},{{ c}_k})]^{\rm{T}}\in {{\bf{R}}^{J \times 1}}$表示第k个隐层神经元对J个输入样本的输出向量, ${{ c}_k}$为第k个隐层神经元的中心, ${w_{k1}}$${w_{k2}}$表示第k个隐层与输出层之间的连接权值. 由于稀疏学习算法的使用,sRBFNN的隐层与输出层之间的部分连接权值将为0,如图4中虚线所示,从而减少网络在测试阶段的计算复杂度.

图 4

图 4   基于稀疏学习的径向基函数神经网络(sRBFNN)结构图

Fig.4   Structure chart of sparse radial basis function neural network(sRBFNN)


sRBFNN分类器[16]首先使用改进的最大数据覆盖率(modified maximum data coverage,MMDC)算法确定初始的隐层结构和参数,然后使用定制分象限有限记忆拟牛顿(specialized orthant-wise limited-memory quasi-newton,SOWL-QN)算法同时优化网络的隐层参数和输出权值. 通过引入L1正则化约束,SOWL-QN算法在最小化正则化代价函数的过程中,自动识别并删除冗余的隐层神经元和输出权值,从而很好地防止过拟合问题,提高网络的泛化能力.

为了验证本文模型所选用的sRBFNN分类器的优越性,使用现有的fp-AML和ccRCC分类研究中常用的RF[26]、kNN[27]和SVM[28]分类器进行对比. 其中,SVM分类器的核函数使用径向基函数.

2. 实验与结果

2.1. 实验数据集

本文的实验数据为苏州大学附属第二医院提供的60例患者的术前腹部延迟期CT图像,经病理证实,42例为ccRCC,18例为fp-AML. 所有患者的CT图像采集时间与病理诊断时间间隔不超过4周,所使用的成像设备为美国GE多排螺旋CT机. 患者空腹进行膈顶至髂极的扫描,扫描参数如下:管电压120 kV,自动毫安技术,截面厚度5 mm,重建切片厚度1 mm. 此外,医院还提供了放射科医生对这批图像所作的影像学诊断结果.

2.2. 性能评价指标

由于fp-AML和ccRCC的研究常常存在数据量较小的问题,交叉验证被广泛应用于此类研究的性能评估[14, 25, 29-30]. 本文采用留一法交叉验证进行分类器的性能评估,因其适用于小样本的数据检测,能提供分类器泛化能力的几乎无偏估计[31]. 留一法交叉验证在每一折验证时,留一个样本用于测试,其余样本用于训练,直至所有样本都被测试过一次.

本文使用2套性能评价指标,第一套为常用的正确率a、敏感度e、特异性s和ROC曲线下面积(area under receiver operating characteristic curve,AUC). 这些指标无法充分提供分类器的决策置信度的信息. 在计算机辅助诊断中,希望计算机所作出的决策是高可信度的,即分类器获得的最大类概率要远大于另一个类概率,否则分类器将不作出决策以减少错误分类. Lukas等[32]在进行多分类时,根据类别数将分类任务划分为多组二分类的形式,使用投票机制完成分类,仅当不少于2/3组给出相同的分类结果时,系统才作出预测,否则系统将不作出决定. Shobeir等[33]为了使分类器所作决策都是高可信度的,设置2个概率阈值αβα>β),当分类器的输出概率处于αβ之间时,系统不作出决定,从而实现系统只有正确分类和未定分类2种情况. 类似地,本文设置概率阈值 ${\lambda _{\rm{p}}}$,模型仅当分类器的最大类概率大于 ${\lambda _{\rm{p}}}$时才作出决策,模型的输出定义如下:

$O = \left\{ {\begin{array}{*{20}{l}} {\arg \mathop {\max }\limits_i \;({p_i}),\;\mathop {\max }\limits_i \;({p_i}) \geqslant {\lambda _{\rm{p}}}}; \\ {u,\;\mathop {\max }\limits_i \;({p_i}) < {\lambda _{\rm{p}}}}. \end{array}} \right.$

式中: ${p_i}$为第i类的输出概率,u为模型不作出决策,由此,模型的分类结果将出现正确、错误和未定3种情况,定义性能评价指标自信正确率Rcc、未定率Ru和错分率Rmc如下:

${R_{{\rm{cc}}}} = {{{N_{{\rm{cc}}}}}}/{{{N_{{\rm{sum}}}}}} \times 100\text{%}, $

${R_{{\rm{mc}}}} = {{{N_{{\rm{mc}}}}}}/{{{N_{{\rm{sum}}}}}} \times 100\text{%}, $

${R_{\rm{u}}} = \frac{{{N_{{\rm{sum}}}} - {N_{{\rm{cc}}}} - {N_{{\rm{mc}}}}}}{{{N_{{\rm{sum}}}}}} \times 100\text{%}. $

式中: ${N_{{\rm{sum}}}}$为样本总数, ${N_{{\rm{cc}}}}$为分类器的最大类概率大于 ${\lambda _{\rm{p}}}$且正确分类的样本数, ${N_{{\rm{mc}}}}$为分类器的最大类概率大于 ${\lambda _{\rm{p}}}$但错误分类的样本数. 可以看出,当 ${\lambda _{\rm{p}}} = 0.50$时,分类模型的Ru=0,此时的Rcc即为常规使用的正确率. 本实验将 ${\lambda _{\rm{p}}}$设定为0.75、0.85和0.95以评估其对各分类器的RccRuRmc的影响.

2.3. 实验结果与分析

2.3.1. 不同分类器的分类性能比较

由于使用了留一法交叉验证,特征选择被执行了60次,经过PCM和Welch’s t检验后,留下108~159个3D特征. 使用SFFS算法选择不同的数量特征,各个分类器的正确率如图5所示. 可见,RF、kNN、SVM和sRBFNN分别在特征数为30、40、10和30时获得最高的正确率,此时的分类性能如表1所示. 可以看出,本文所使用的sRBFNN分类器的性能明显优于其他3种常用的分类器. 特别地,sRBFNN获得了100.0%的特异性,这意味着所有的恶性患者均能得到正确的治疗. 虽然RF也获得了同样的特异性,但其敏感度低于sRBFNN,即若采用RF分类器构建的模型,较多的良性患者将接受不必要的手术.

图 5

图 5   基于不同数量3D特征的4种分类器的正确率比较

Fig.5   Accuracy comparison of four classifiers based on different number of selected 3D features


表 1   4种分类器的最优性能比较

Tab.1  Comparison of best performance of four classifiers

分类器 a/% e/% s/% AUC
RF 86.67 55.56 100.0 0.748 0
kNN 86.67 61.11 97.62 0.789 7
SVM 86.67 61.11 97.62 0.672 0
sRBFNN 90.00 66.67 100.0 0.917 3

新窗口打开| 下载CSV


为了进一步评估分类器所作决策的可靠性,将 ${\lambda _{\rm{p}}}$定为0.75、0.85和0.95,依次计算4种分类器在最高正确率下的RccRuRmc,结果如图6所示. 可以看出,当阈值增大时,分类器的RccRmc随之降低,Ru明显提高. 当 ${\lambda _{\rm{p}}} = 0.95$时,SVM获得的Rmc为0,但其Ru高达98.33%,这意味着使用SVM所构建的模型,虽然可以保证其做出的决策均是正确的,但是医生仍需对几乎全部病人进行诊断. 而在三个概率阈值下,sRBFNN的Rcc均远高于其他3种分类器. 假设分类器1与分类器2的Rmc之差为 $\Delta {R_{{\rm{mc}}}}$,则当 ${\lambda _{\rm{p}}} = 0.95$时,RF与sRBFNN的 $\Delta {R_{{\rm{mc}}}} = 1.67\% $的同时,Rcc还比sRBFNN低41.67%;kNN与sRBFNN的 $\Delta {R_{{\rm{mc}}}} = - 1.66\% $,但sRBFNN的Rcc比kNN高61.67%. 因此,使用sRBFNN分类器构建的模型进行辅助诊断比其他3种分类器更可靠,且能更大程度地减少医生的工作量.

图 6

图 6   4种分类器的可靠性评估

Fig.6   Confident evaluation of four classifiers


2.3.2. 2D和3D特征的鉴别能力比较

为了验证3D特征的有效性,在每个ROI的中间切片上提取算法中的影像组学特征进行实验. 由于在二维空间中DWT仅能将原始图像分解为4种信号,从每张中间切片共提取430个特征. 此时,在选择不同的特征数下sRBFNN分类器所获得的正确率如图7所示. 当选择的特征数量为50时获得最优性能,如表2所示. 可以看出,当使用提出的影像组学方法时,2D特征所获得的正确率低于3D特征,且无法正确诊断所有的恶性患者.

图 7

图 7   基于不同数量2D特征的分类器正确率

Fig.7   Accuracy of classifiers based on different numbers of 2D features


表 2   基于2D和3D特征的分类结果对比

Tab.2  Comparison of classification results of 2D and 3D features

评价指标 a/% e/% s/% AUC
2D特征 83.33 66.67 90.48 0.862 4
3D特征 90.00 66.67 100.0 0.917 3

新窗口打开| 下载CSV


对由2D和3D特征获得的可靠性评估结果进行对比,如图8所示. 当 ${\lambda _{\rm{p}}}$为0.85和0.95时,2D特征所获得的Rmc与3D特征相同,但其R比3D特征分别低了15%和36.67%. 实验结果表明,使用本文方法时,3D特征的鉴别能力优于2D特征.

图 8

图 8   基于2D和3D特征的模型分类的可靠性对比

Fig.8   Comparison of classification reliability of model based on 2D and 3D features


2.3.3. 本文模型和放射科医生的分类结果比较

为了评估提出模型的有效性,将模型的分类结果与医院提供的放射科医生的影像学诊断结果进行对比,如表3所示. 其中, ${N_{\rm{c}}}$为正确诊断的患者数, ${N_{\rm{u}}}$为未定数, ${N_{\rm{m}}}$为误诊数. 医生未定的4例患者是医生根据CT图像无法作出诊断,需进行病理检查. 后续的病理检查结果显示这4例患者均为ccRCC,误诊的8例患者均为将fp-AML诊断为ccRCC,可见,医生仅凭CT图像来鉴别fp-AML和ccRCC是比较困难的.

表 3   本文模型和放射科医生的分类结果对比

Tab.3  Comparison between classification results of proposed model and radiologists

本文模型 分类方法 放射科医生
λp = 0.50 λp = 0.75 λp = 0.85 λp = 0.95
Nc 48 54 51 45 43
Nu 4 0 3 10 15
Nm 8 6 6 5 2

新窗口打开| 下载CSV


${\lambda _{\rm{p}}} = 0.50$时,本文提出的模型无未定病例,误诊6例,即可以将医生未定的4例患者和2例误诊的患者正确诊断. 值得一提的是,在 ${\lambda _p} = 0.95$时,模型依然能将这2例患者正确分类. 随着概率阈值的提高,模型的误诊病例逐渐减少,当 ${\lambda _{\rm p}} = 0.95$时,提出的模型能可靠地正确分类43例患者,仅错分2例. 这2例错分的fp-AML同样被放射科医生误诊,CT图像如图9所示. 从比较结果可以看出,本文提出的影像组学模型可以辅助医生进行诊断,能大大减少医生的工作量.

图 9

图 9   本文模型和放射科医生误诊的2例fp-AML

Fig.9   Two fp-AML cases misclassified by proposed model and radiologists


3. 结 语

本文提出了一种3D特征驱动的影像组学模型用于准确和无侵入地分类fp-AML和ccRCC. 该模型对图像的3D特征进行提取,实现了更全面的肿瘤特性描绘;结合PCM、Welch’s t检验和SFFS算法进行三步特征选择,实现了更有效的特征选择;使用sRBFNN分类器进行分类,更有效地防止了过拟合问题,提高了模型的泛化能力.

实验证明:1)sRBFNN分类器的分类性能优于其他3种被广泛使用的分类器. 2)使用本文的方法时,3D特征的鉴别能力优于2D特征. 3)提出的影像组学模型能准确可靠地分类fp-AML和ccRCC,能辅助放射科医生非侵入地鉴别fp-AML和ccRCC. 在下一步研究中,将收集更多的数据来进一步验证本文结论,并尝试将所提出的模型推广到其他肾脏疾病的分类中.

参考文献

HSIEH J J, PURDUE P M, SIGNORETTI S, et al

Renal cell carcinoma

[J]. Nature Reviews Disease Primers, 2017, 3: 17009

DOI:10.1038/nrdp.2017.9      [本文引用: 2]

WORLD Cancer Research Fund International. Kidney cancer statistics [J/OL]. Available at https://www.wcrf.org/dietandcancer/cancer-trends/kidney-cancer-statistics, January 2018.

[本文引用: 1]

WEI J, ZHAO J, ZHANG X, et al

Analysis of dual energy spectral CT and pathological grading of clear cell renal cell carcinoma (ccRCC)

[J]. PLOS ONE, 2018, 13 (5): e0195699

DOI:10.1371/journal.pone.0195699      [本文引用: 1]

JINZAKI M, SIVERMAN S G, and TANIMOTO A

Angiomyolipoma that do not contain fat attenuation at unenhanced CT

[J]. Radiology, 2005, 234 (1): 311

DOI:10.1148/radiol.2341041128      [本文引用: 1]

PRASAD S R, SURABHI V R, MENIAS C O, et al

Benign renal neoplasms in adults: cross-sectional imaging findings

[J]. American Journal of Roentgenology, 2008, 190 (1): 158- 164

DOI:10.2214/AJR.07.2724      [本文引用: 1]

HALPENNY D, SNOW A, MCNEILL G, et al

The radiological diagnosis and treatment of renal angiomyolipoma-current status

[J]. Clinical Radiology, 2010, 65 (2): 99- 108

DOI:10.1016/j.crad.2009.09.014      [本文引用: 1]

LANE B R, AYDIN H, DANFORTH T L, et al

Clinical correlates of renal angiomyolipoma subtypes in 209 patients: classic, fat poor, tuberous sclerosis associated and epithelioid

[J]. The Journal of Urology, 2008, 180 (3): 836- 843

DOI:10.1016/j.juro.2008.05.041      [本文引用: 1]

FENG Z, RONG P, CAO P, et al

Machine learning-based quantitative texture analysis of CT images of small renal masses: differentiation of angiomyolipoma without visible fat from renal cell carcinoma

[J]. European Radiology, 2018, 28 (4): 1625- 1633

DOI:10.1007/s00330-017-5118-z      [本文引用: 1]

LEE H S, HONG H, JUNG D C, et al

Differentiation of fat-poor angiomyolipoma from clear cell renal cell carcinoma in contrast-enhanced MDCT images using quantitative feature classification

[J]. Medical Physics, 2017, 44 (7): 3604- 3614

DOI:10.1002/mp.2017.44.issue-7      [本文引用: 1]

MOLINA D, JULIÁN P, BELÉN L, et al

Tumour heterogeneity in glioblastoma assessed by MRI texture analysis: a potential marker of survival

[J]. The British Journal of Radiology, 2016, 89 (1064): 20160242

DOI:10.1259/bjr.20160242      [本文引用: 1]

LAMBIN P, LEIJENAAR R T H, DEIST T M, et al

Radiomics: the bridge between medical imaging and personalized medicine

[J]. Nature Reviews Clinical Oncology, 2017, 14: 749

DOI:10.1038/nrclinonc.2017.141      [本文引用: 1]

ELISABETTA D B, BUDA A, GUERRA L, et al

Radiomics of the primary tumour as a tool to improve 18F-FDG-PET sensitivity in detecting nodal metastases in endometrial cancer

[J]. EJNMMI Research, 2018, 8 (1): 86

DOI:10.1186/s13550-018-0441-1      [本文引用: 1]

FERREIRA JUNIOR J R, KOENIGKAM-SANTOS M, CIPRIANO F E G, et al

Radiomics-based features for pattern recognition of lung cancer histopathology and metastases

[J]. Computer Methods and Programs in Biomedicine, 2018, 159: 23- 30

DOI:10.1016/j.cmpb.2018.02.015      [本文引用: 1]

SAPATE S G, MAHAJAN A, TALBAR S N, et al

Radiomics based detection and characterization of suspicious lesions on full field digital mammograms

[J]. Computer Methods and Programs in Biomedicine, 2018, 163: 1- 20

DOI:10.1016/j.cmpb.2018.05.017      [本文引用: 1]

MENG X, XIA W, XIE P, et al

Preoperative radiomic signature based on multiparametric magnetic resonance imaging for noninvasive evaluation of biological characteristics in rectal cancer

[J]. European Radiology, 2018, 1- 10

[本文引用: 1]

QIAN X, HUANG H, CHEN X, et al

Efficient construction of sparse radial basis function neural networks using L1-regularization

[J]. Neural Networks, 2017, 94: 239- 254

DOI:10.1016/j.neunet.2017.07.004      [本文引用: 3]

LUBNER M G, SMITH A D, SANDRASEGARAN K, et al

CT texture analysis: definitions, applications, biologic correlates, and challenges

[J]. RadioGraphics, 2017, 37 (5): 1483- 1503

DOI:10.1148/rg.2017170056      [本文引用: 2]

ZWANENBURG A, LEGER S, VALLIÈRES M, et al. Image biomarker standardisation initiative-feature definitions [J/OL]. arXiv eprints, 2016. https://ui.adsabs.harvard.edu/abs/2016arXiv161207003Z

[本文引用: 2]

AERTS H J, VELAZQUEZ E R, LEIJENAAR R T, et al

Decoding tumour phenotype by noninvasive imaging using a quantitative radiomics approach

[J]. Nature Communications, 2014, 5: 4006

DOI:10.1038/ncomms5006      [本文引用: 1]

HARIKUMAR R and VINOTH KUMAR B

Performance analysis of neural networks for classification of medical images with wavelets as a feature extractor

[J]. International Journal of Imaging Systems and Technology, 2015, 25 (1): 33- 40

DOI:10.1002/ima.v25.1      [本文引用: 1]

PEARSON K

Note on regression and inheritance in the case of two parents

[J]. Proceedings of the Royal Society of London, 1895, 58: 240- 242

DOI:10.1098/rspl.1895.0041      [本文引用: 1]

DERRICK B and WHITE P

Why Welch’s test is type I error robust

[J]. The Quantitative Methods in Psychology, 2016, 12 (1): 30- 38

DOI:10.20982/tqmp.12.1.p030      [本文引用: 1]

AHA D W, BANKERT R L. A Comparative Evaluation of Sequential Feature Selection Algorithms [M]. New York: Springer, 1996: 199-206.

[本文引用: 1]

FALLAHPOUR S, LAKVAN E N, and ZADEH M H

Using an ensemble classifier based on sequential floating forward selection for financial distress prediction problem

[J]. Journal of Retailing and Consumer Services, 2017, 34: 159- 167

DOI:10.1016/j.jretconser.2016.10.002      [本文引用: 1]

BUGDOL M D, BUGDOL M N, LIPOWICZ A M, et al

Prediction of menarcheal status of girls using voice features

[J]. Computers in Biology and Medicine, 2018, 100: 296- 304

DOI:10.1016/j.compbiomed.2017.11.005      [本文引用: 2]

PARMAR C, GROSSMANN P, BUSSINK J, et al

Machine learning methods for quantitative radiomic biomarkers

[J]. Scientific Reports, 2015, 5: 13087

DOI:10.1038/srep13087      [本文引用: 1]

JOSHI A, METHA A

Analysis of K-nearest neighbor technique for breast cancer disease classification

[J]. International Journal of Recent Scientific Research, 2018, 9 (4): 26126- 26130

[本文引用: 1]

JOSÉ LUIS R, MANEL M, JORDI M, et al. Support vector machine and kernel classification algorithms [C] // Digital Signal Processing with Kernel Methods. New Jersey: Wiley-IEEE Press, 2018: 672.

[本文引用: 1]

CHENG J Z, NI D, CHOU Y H, et al

Computer-aided diagnosis with deep learning architecture: applications to breast lesions in US images and pulmonary nodules in CT scans

[J]. Scientific Reports, 2016, 6: 24454

DOI:10.1038/srep24454      [本文引用: 1]

LEE H, HONG H, KIM J, et al

Deep feature classification of angiomyolipoma without visible fat and renal cell carcinoma in abdominal contrast-enhanced CT images with texture image patches and hand-crafted feature concatenation

[J]. Medical Physics, 2018, 45 (4): 1550

DOI:10.1002/mp.2018.45.issue-4      [本文引用: 1]

CHAPELLE O, VAPNIK V, BOUSQUET O, et al

Choosing multiple parameters for support vector machines

[J]. Machine Learning, 2002, 46 (1): 131- 159

[本文引用: 1]

LUKAS L, DEVOS A, SUYKENS J A K, et al

Brain tumor classification based on long echo proton MRS signals

[J]. Artificial Intelligence in Medicine, 2004, 31 (1): 73- 89

DOI:10.1016/j.artmed.2004.01.001      [本文引用: 1]

FAKHRAEI S, SOLTANIAN-ZADEH H, FOTOUHI F, et al. Confidence in medical decision making: application in temporal lobe epilepsy data mining [C] // Workshop on Data Mining for Medicine and Healthcare. San Diego: [s.n.], 2011: 60–63.

[本文引用: 1]

/