文章快速检索     高级检索
  浙江大学学报(理学版)  2018, Vol. 45 Issue (6): 721-727  DOI:10.3785/j.issn.1008-9497.2018.06.013
0

引用本文 [复制中英文]

堵锡华, 王超. 乌药化学成分结构参数与色谱保留时间的关系[J]. 浙江大学学报(理学版), 2018, 45(6): 721-727. DOI: 10.3785/j.issn.1008-9497.2018.06.013.
[复制中文]
DU Xihua, WANG Chao. Correlation between structural parameters of Lindera Aggregata's chemical compositions and the retention time of chromatogram[J]. Journal of Zhejiang University(Science Edition), 2018, 45(6): 721-727. DOI: 10.3785/j.issn.1008-9497.2018.06.013.
[复制英文]

基金项目

国家自然科学基金资助项目(21472071,21473081)

作者简介

堵锡华(1963-), ORCID:http://orcid.org/0000-0002-1654-6687, 男, 学士, 教授, 主要从事药物、食品构效关系研究, E-mail:12dxh@sina.com

文章历史

收稿日期:2017-11-02
乌药化学成分结构参数与色谱保留时间的关系
堵锡华 , 王超     
徐州工程学院 化学化工学院, 江苏 徐州 221018
摘要: 乌药含有呋喃倍半萜、黄酮、生物碱、挥发油等多种化学成分,具有抗氧化、抗肿瘤及抑菌等活性.为研究乌药化学成分的性质,计算了乌药化学成分的分子连接性指数和电性拓扑状态指数,并筛选分子连接性指数中的0X5X5Xc,以及电性拓扑状态指数中的E1E2E3,将这6种结构指数作为神经网络的输入层变量,色谱保留时间作为输出层变量,做回归分析,采用6:5:1的神经网络结构,构建了预测能力较强的预测模型.该模型总相关系数rt为0.994 0,训练集相关系数为0.992 9,测试集相关系数为0.997 0,验证集相关系数为0.997 9,利用该模型计算得到的保留时间预测值与实验值吻合度较好,相对平均误差为2.66%.结果表明,乌药化学成分的色谱保留时间与6种结构参数之间具有良好的非线性关系.
关键词: 乌药    化学成分    色谱保留时间    分子连接性指数    电性拓扑状态指数    神经网络    
Correlation between structural parameters of Lindera Aggregata's chemical compositions and the retention time of chromatogram
DU Xihua, WANG Chao     
School of Chemistry and Chemical Engineering, Xuzhou Institute of Technology, Xuzhou 221018, Jiangsu Province, China
Abstract: Lindera aggregata consists of many chemical compositions, such as furan sesquiterpene, flavonoid, alkaloid and volatile oil, and has the features of anti-oxidant, anti-tumor and anti-bacterial. In order to further study the features of Lindera aggregate's chemical compositions, the molecular connectivity indices and electrical topological state indices of Lindera aggregata's chemical compositions were calculated. The molecular connectivity indices 0X, 5X and 5Xc, as well as the electrical topological state indices E1, E2 and E3 were selected. Then, the regression method was employed to analyze the six indices and the retention time of chromatogram. We used this six indices as input variables of a neural network and the retention time of chromatogram as the output variable. Meanwhile, the 6:5:1 network structure was adopted to establish a satisfying neural network model with good predictive ability. The total correlation coefficient rt of the model was 0.994 0, the correlation coefficient r1 of training set was 0.992 9, the correlation coefficient r2 of test set was 0.997 0 and the correlation coefficient r3 of validation set was 0.997 9. The predicted values and the experiment values were relatively close, and the mean relative error was 2.66%. The results show that there exists a good nonlinear relationship between the retention time of chromatogram and the six structural parameters.
Key Words: Lindera aggregata    chemical compositions    retention time of chromatogram    molecular connectivity index    electrical topological state index    neural network    

乌药为樟科山胡椒属植物常绿灌木乌药的干燥根,湖南、浙江、江苏、江西等我国长江以南地区均有分布,为常用的理气镇痛药,具有行气止痛、温肾散寒之功效[1],亦有抗炎、抗氧化及抑菌等生物活性[2-3],常用来医治由跌打损伤、腹部疼痛、寒疝及脉管炎、心脏病引起的心胸疼痛等症[4].目前,国内外对乌药的化学成分分析及工艺提取、抗氧化特性、抗病毒及抗肿瘤活性等方面有较为深入的研究[5-8],其中,对化学成分分析的相关研究较为常见[9-11],对化学成分性质的研究则较少.

保留时间是气相色谱(GC)定性分析的重要指标,化合物分子的保留时间等相关定性数据数量庞大无法通过实验一一获取,因此将宏观的保留值与分子的微观结构联系起来,是气相色谱保留值定性和智能高效化的重要理论依据[12].本文将定量结构-保留相关性研究方法与在化学[13-14]、药物化学[15]、环境科学[16]等领域得到广泛应用的人工神经网络(artificial neural networks,ANN)方法相结合,针对文献[17]得到的湖南产乌药68种化学成分的色谱保留时间,建立其与分子连接性指数、电性拓扑状态指数的BP神经网络模型.本文通过分析乌药化学成分的分子结构,用获得的相关结构指数预测色谱保留时间的数据,预测的保留时间与实验值的相对平均误差为2.66%.研究为通过气相色谱法快速高效检测乌药复杂的化学成分提供了理论依据.

1 研究方法 1.1 保留时间数据来源

湖南产乌药68种化学成分的色谱保留时间数据来自文献[17],详见表 1.

表 1 乌药化学成分的结构参数及色谱保留时间 Table 1 Structural parameters and retention time of chemical constituents of Lindera aggregata
1.2 指数计算

利用Chemoffice绘图软件绘制乌药68种化学成分的分子结构图,在Matlab软件中调用该分子结构,依照文献[18-19]的方法自编程序,计算68个分子的分子连接性指数和电性拓扑状态指数,剔除二类指数中大部分数据为0的数组,对余下的数组用Minitab软件中最佳变量子集回归法进行筛选,将连接性指数(0X5X5Xc)和电性拓扑状态指数(E1E2E3)相结合,寻找与乌药化学成分色谱保留时间相关性最强的结构参数.各指数值见表 1.

2 模型的建构 2.1 相关性分析和稳定性检验

将Minitab软件最佳变量子集回归筛选的6种连接性指数和电性拓扑状态指数与乌药化学成分的色谱保留时间进行回归分析,得到相关性方程:

$ \begin{array}{l} t = 6.329{^0}X - 5.725{^5}X + 8.458{^5}{X_{c}} - \\ \;\;\;\;\;\;\;\;\;\;0.815{E_{1}} - 0.663{E_2} - 2.206{E_3} - 2.838{\rm{, }}\\ N{\rm{ }} = 68{\rm{, }}n = 6{\rm{, }}r{\rm{ }} = 0.932{\rm{, }}{r^2} = 0.868{\rm{, }}r_{{\rm{adj}}}^2 = 0.855{\rm{, }}\\ \;\;\;\;\;\;\;\;\;\;\;r_{{\rm{cv}}}^2 = 0.836{\rm{, }}S = 2.638{\rm{, }}F = 66.965, \end{array} $ (1)

其中,Nnrr2radj2rcv2SF分别为样本数、变量数、相关系数、判定系数、调整的可决系数、交互检验相关系数、标准误差、Fischer检验值.

可以看到,模型交叉验证的相关系数rcv2为0.836,大于0.5,而且调整的可决系数radj2(0.855)与交互检验相关系数rcv2(0.836)的差值为0.019,远小于0.3;同时用Jackknifed逐一剔除法对式(1)进行稳健性检验,得到68个检验相关系数(见表 2),平均值为0.932,与式(1)的相关系数完全吻合,说明模型的稳定性较好.

表 2 Jackknifed相关系数的检验 Table 2 Inspection of Jackknifed correlation coefficient r

对这68个相关系数作直方图(见图 1),Jackknifed r基本呈正态分布;为检明乌药化学分子中是否存在“离域”的色谱保留时间,对68个相关系数以0.920为圆心,0.002为间距作雷达图(见图 2),68个Jackknifed r值均落在区间内,说明模型不存在异常的保留时间值.

图 1 Jackknifed相关系数r的直方图 Fig. 1 Histogram of correlation coefficent r
图 2 Jackknifed相关系数r的雷达图 Fig. 2 Radar map of Jackknifed correlation coefficent r
2.2 模型的建构

以优化筛选的连接性指数(0X5X5Xc)和电性拓扑状态指数(E1E2E3)为神经网络的输入变量,以湖南产乌药化学成分的色谱保留时间为输出变量,综合Andrea和文献[20]中2种隐含层变量选择规则,得到:

$ 2.2 > N/M \ge 1.4, $ (2)

其中,N为总样本数,M为总权重,计算公式为

$ M = \left( {{I_{\rm{m}}} + 1} \right){H_{\rm{i}}} + ({H_{\rm{i}}} + 1){O_{\rm{u}}}{\rm{, }} $ (3)

其中,ImHiOu分别为神经网络三层结构中输入层、隐含层和输出层的变量数.这里,输入层变量数Im=6,保留时间作为输出层变量数Ou = 1,故隐含层变量Hi可取4或5.经比较,当Hi取5时,模型的相关系数值最大,故本模型采用6:5:1的网络结构,隐含层采用tansig传递函数,输出层采用purelin传递函数,迭代次数为3 000次.

为防止“过训练、过拟合”,在数据运算过程中,将68种化学成分分为训练集(以每5个分子作为一组,取其中第1,3,4个分子)、测试集(取每组的第2个分子)和验证集(取每组的第5个分子,依此类推),对其进行神经网络法分析,模型总相关系数rt达0.994 0,相关性较高,训练集相关系数r1达到0.992 9,测试集相关系数r2达到0.997 0,验证集相关系数r3达到0.997 9,可以看出,训练集、测试集、验证集的相关系数与总相关系数较为接近,利用该神经网络模型预测得到的乌药化学成分的色谱保留时间与文献方法分析检测的实验值吻合度较高,平均相对误差为2.66%,预测值与实验值关系见图 3.图 3中无特别远离直线的点,说明预测值较接近实验值.

图 3 保留时间的实验值与预测值的相关性 Fig. 3 Relationship between experiment and predicted values of t
3 结果与讨论

乌药因具有多种抗炎、抗氧化、抗肿瘤的活性成分,成为越来越多研究者关注的热点.大量研究证实,乌药含有丰富的呋喃倍半萜及其内酯、黄酮、生物碱、挥发油等成分,由于成分较为复杂,难以用实验方法对其性质一一研究.为此,本文通过计算乌药化学成分的分子连接性指数和电性拓扑状态指数,筛选出能反映分子空间结构信息的3种连接性指数(0X5X5Xc),以及能反映电子结构信息的3种电性拓扑状态指数(E1E2E3),结合这6种指数构建BP神经网络模型,能很好地反映乌药化学成分色谱保留时间的变化规律.

当外部检测条件一定时,本模型中的3种连接性指数(0X5X分别代表 0价、5价的路径指数,5Xc代表簇项指数)说明碳原子的个数以及原子之间的连接方式对保留时间有影响;3种电性拓扑状态指数(E1代表“—CH3”基团的取值,E2代表“—CH2—”基团的取值,E3代表“>CH—”基团的取值)则说明分子中伯、仲、叔碳原子对保留时间有影响,但同样是伯碳原子、仲碳原子或叔碳原子,由于所处位置不同,原子之间的相互作用力就不同,各性质特征值也不同,因此,只有将连接性指数与电性拓扑状态指数相结合构建的模型,才能反映这一规律.从表 1所列的分子及保留时间可以看出,当检测条件固定时,碳原子及基团的数量、连接方式、范德华作用力、色散力、诱导力等均对保留时间产生影响,当碳原子数增加时,分子体积增大,色散力增大,保留时间延长.

筛选出的分子结构指数与乌药化学成分的色谱保留时间呈高度的非线性关系.本文根据分子拓扑结构、电性结构特征构建的神经网络模型,有良好的稳定性,预测能力较强.对预测湖南产乌药化学成分的色谱保留时间、探索色谱保留机制、选择合适的色谱条件有一定的指导作用.

参考文献
[1] 钱俊青, 许雅颖, 卢时勇. 乌药超声提取工艺的研究[J]. 氨基酸和生物资源, 2011, 33(4): 63–66.
QIAN J Q, XU Y Y, LU S Y. Study on the ultrasonic extraction of Lindera aggregate[J]. Amino Acids & Biotic Resources, 2011, 33(4): 63–66. DOI:10.3969/j.issn.1006-8376.2011.04.019
[2] 钟慧, 钟勇, 卿朕, 等. 2种中药植物提取物抑菌活性初步研究[J]. 河南农业科学, 2015, 44(9): 64–68.
ZHONG H, ZHONG Y, QING Z, et al. Preliminary studies on antifungal activity of two Chinese herbal medicinal plant extracts[J]. Journal of Henan Agricultural Sciences, 2015, 44(9): 64–68.
[3] 朱跃真, 刘明川, 胡德禹, 等. 黔产乌药化学成分研究[J]. 中国实验方剂学杂志, 2012, 18(16): 123–126.
ZHU Y Z, LIU M C, HU D Y, et al. Chemical constituents of Lindera aggregata[J]. Chinese Journal of Experimental Traditional Medical Formulae, 2012, 18(16): 123–126.
[4] 刘泽坤, 陈海霞. 三桠乌药树皮及茎枝中挥发油成分GC-MS分析[J]. 安徽农业科学, 2011, 39(24): 14639–14641.
LIU Z K, CHEN H X. GC-MS analysis of volatile oils from the barks and twigs of Lindera obtusiloba Bl[J]. Journal of Anhui Agricultural Science, 2011, 39(24): 14639–14641. DOI:10.3969/j.issn.0517-6611.2011.24.045
[5] 许海丹, 顾霞敏. 乌药叶中总黄酮提取工艺的研究[J]. 科学技术与工程, 2010, 10(26): 6515–6518.
XU H D, GU X M. Study on the process for extracting total flavonoids from Lindera aggregata leaves[J]. Science Technology and Engineering, 2010, 10(26): 6515–6518. DOI:10.3969/j.issn.1671-1815.2010.26.033
[6] OHNO T, NAGATSU A, NAKAGAWA M, et al. New sesquiterpene lactones from water extract of the root of Lindera strychnifolia with cytotoxicity against the human small cell lung cancer cell, SBC-3[J]. Tetrahedron Letters, 2005, 46(50): 8657–8660. DOI:10.1016/j.tetlet.2005.10.051
[7] OHNO T, TAKEMURA G, MURATA I, et al. Water extract of the root of Lindera strychnifolia slows down the progression of diabetic nephropathy in db/db mice[J]. Life Sciences, 2005, 77(12): 1391–1403. DOI:10.1016/j.lfs.2005.04.018
[8] 晏润纬, 花金红. 乌药根挥发油的体外抗肿瘤活性及其有效成分分析[J]. 武汉大学学报(理学版), 2014, 60(4): 345–348.
YAN R W, HUA J H. In vitro antitumor activity of Lindera strychnifolia root essential oil and its active constituent[J]. Journal of Wuhan University (Natural Science Edition), 2014, 60(4): 345–348.
[9] 何桂霞, 易海燕, 郭建生, 等. 超临界CO2萃取和水蒸汽蒸馏法研究乌药中挥发性有机物[J]. 天然产物研究与开发, 2010, 22(5): 816–819, 825.
HE G X, YI H Y, GUO J S, et al. Comparison of the constituents of essential oil from Lindera aggregata by supercritical CO2 fluid extraction and steam distillation[J]. Natural Product Research and Development, 2010, 22(5): 816–819, 825. DOI:10.3969/j.issn.1001-6880.2010.05.020
[10] 海萍, 高原, 李蓉涛, 等. 乌药的化学成分研究[J]. 中草药, 2016, 47(6): 872–875.
HAI P, GAO Y, LI R T, et al. Chemical constituents from roots of Lindera aggregata[J]. Chinese Traditional and Herbal Drugs, 2016, 47(6): 872–875.
[11] WANG F, GAO Y, ZHANG L, et al. Bi-linderone, a highly modified methyl-linderone dimer from Lindera aggregata with activity toward improvement of insulin sensitivity in vitro[J]. Organic Letters, 2010, 12(10): 2354–2357. DOI:10.1021/ol1007247
[12] 卢佩章, 戴朝政, 张祥民. 色谱理论基础[M]. 第二版. 北京: 科学出版社, 1998: 207.
LU P Z, DAI C Z, ZHANG X M. Basic Theory of Chromatography[M]. 2nd ed. Beijing: Science Press, 1998: 207.
[13] 堵锡华. 用新的路径定位指数和神经网络研究多溴联苯醚理化性质[J]. 化工学报, 2014, 65(4): 1169–1178.
DU X H. Physicochemical property of polybrominated diphenyl ethers by new path location index and neural network[J]. CIESC Journal, 2014, 65(4): 1169–1178. DOI:10.3969/j.issn.0438-1157.2014.04.003
[14] DU X H, ZHUANG W C, SHI X Q, et al. Research on thermodynamic properties of polybrominated diphenylamine by neural network[J]. Chinese Journal of Chemical Physics, 2015, 28(1): 59–64.
[15] PRADO-PRADO F J, GARCÍA-MERA X, GONZÁLEZ-DÍAZ H. Multi-target spectral moment QSAR versus ANN for antiparasitic drugs against different parasite species[J]. Bioorganic & Medicinal Chemistry, 2010, 18(6): 2225–2231.
[16] 堵锡华, 王超. 硝基芳烃化合物急性毒性预测的理论研究[J]. 生态环境学报, 2017, 26(7): 1152–1156.
DU X H, WANG C. Theoretical studies on the acute toxicity of nitroaromatic compounds by neural network method[J]. Ecology and Environmental Sciences, 2017, 26(7): 1152–1156.
[17] 邓桂明, 向彪, 肖小芹, 等. 基于GC-MS和UPLC-ESI-MS/MS法研究乌药化学成分[J]. 中药材, 2016, 39(10): 2229–2236.
DENG G M, XIANG B, XIAO X Q, et al. Study on chemical constituents of Lindera aggregate by GC-MS and UPLC-ESI-MS/MS[J]. Journal of Chinese Medicinal Materials, 2016, 39(10): 2229–2236.
[18] 张婷, 梁逸曾, 赵晨曦, 等. 基于分子结构预测气相色谱程序升温保留指数[J]. 分析化学, 2006, 34(11): 1607–1610.
ZHANG T, LIANG Y Z, ZHAO C X, et al. Prediction of temperature-programmed retention indices from molecule structures[J]. Chinese Journal of Analytical Chemistry, 2006, 34(11): 1607–1610. DOI:10.3321/j.issn:0253-3820.2006.11.021
[19] 胡黔楠, 梁逸曾, 王亚丽, 等. 直观队列命名法的基本原理及其在矩阵与拓扑指数计算中的应用[J]. 计算机与应用化学, 2003, 20(4): 386–390.
HU Q N, LIANG Y Z, WANG Y L, et al. The basic principles of heuristic queue notation and its applications in calculation of matrix and topological index for topological graphs[J]. Computers and Applied Chemistry, 2003, 20(4): 386–390. DOI:10.3969/j.issn.1001-4160.2003.04.020
[20] 许禄, 邵学广. 化学计量学方法[M]. 北京: 科学出版社, 2004: 441.
XU L, SHAO X G. Methods of Chemometrics[M]. Beijing: Science Press, 2004: 441.