紫色球杆菌视紫红质光谱特性的机器学习研究

doi:10.3785/j.issn.1008-9497.2022.03.003

[1]

MUGGLETON

S

， KING

R D

， STENBERG

M J E

.

Protein secondary structure prediction using logic-based machine learning

［J］. Protein Engineering， 1992， 5（7）： 647-657. DOI：10.1093/protein/5.7.647

[本文引用: 1]

[2]

易华伟，唐晓峰.

基于氨基酸序列和模拟结构预测蛋白质稳定性的研究进展

［J］. 生物技术通报， 2017， 33（4）： 83-89. DOI：10.13560/j.cnki.biotech.bull. 1985.2017.04.011

[本文引用: 1]

YI

H W

， TANG

X F

.

Research progress on the prediction of protein stability based on amino acid sequence and simulated structure

［J］. Biotechnology Bulletin， 2017， 33（4）： 83-89. DOI：10.13560/j.cnki.biotech.bull.1985.2017.04.011

[本文引用: 1]

[3]

程淑萍，谭建军，门婧睿.

基于机器学习方法的非编码RNA-蛋白质相互作用的预测

［J］. 北京生物医学工程， 2019， 38（4）： 353-359. DOI：10.3969/j.issn. 1002-3208.2019.04.004

[本文引用: 1]

CHENG

S P

， TAN

J J

， MEN

J R

.

Prediction of ncRNA-protein interactions based on machine learning methods

［J］. Beijing Biomedical Engineering， 2019， 38 （4）： 353-359. DOI：10.3969/j.issn.1002-3208.2019.04.004

[本文引用: 1]

[4]

徐开琨，韩明飞，黄传玺，等.

基于质谱的蛋白质生物标志物发现中的特征选择与机器学习方法研究进展

［J］. 生物工程学报， 2019， 35（9）： 1619-1632. DOI：10. 13345/j.cjb.190064

[本文引用: 1]

XU

K K

， HAN

M F

， HUANG

C X

， et al.

Research progress of feature selection and machine learning methods for mass spectrometry-based protein biomarker discovery

［J］. Chinese Journal of Biotechnology， 2019， 35（9）： 1619-1632. DOI：10. 13345/j.cjb.190064

[本文引用: 1]

[5]

胡如云，张嵩亚，蒙海林，等.

面向合成生物学的机器学习方法及应用

［J］. 科学通报， 2021， 66（3）： 284-299. DOI：10.1360/TB-2020-0456

[本文引用: 1]

HU

R Y

， ZHANG

S Y

， MENG

H L

， et al.

Machine learning for synthetic biology： Methods and applications

［J］. Chinese Science Bulletin， 2021， 66（3）： 284-299. DOI：10.1360/TB-2020-0456

[本文引用: 1]

[6]

HAMMER

S C

， KNIGHT

A M

， ARNOLD

F H

.

Design and evolution of enzymes for non-natural chemistry

［J］. Current Opinion in Green and Sustainable Chemistry， 2017， 7： 23-30. DOI：10. 1016/j.cogsc.2017.06.002

[本文引用: 1]

[7]

CHOI

Y H

， KIM

J H

， PARK

B S

， et al.

Solubilization and iterative saturation mutagenesis of α1，3-fucosyltransferase from helicobacter pylori to enhance its catalytic efficiency

［J］. Biotechnology and Bioengineering， 2016， 113（8）： 1666-1675. DOI：10. 1002/bit.25944

[本文引用: 1]

[8]

曲戈，朱彤，蒋迎迎，等.

蛋白质工程：从定向进化到计算设计

［J］. 生物工程学报， 2019， 35（10）： 1843-1856. DOI：10.13345/j.cjb.190221

[本文引用: 1]

QU

G

， ZHU

T

， JIANG

Y Y

， et al.

Protein engineering： From directed evolution to computational design

［J］. Chinese Journal of Biotechnology， 2019， 35（10）： 1843-1856. DOI：10.13345/j.cjb.190221

[本文引用: 1]

[9]

蒋迎迎，曲戈，孙周通.

机器学习助力酶定向进化

［J］. 生物学杂志， 2020， 37（4）： 1-11. DOI：10.3969/j.issn.2095-1736.2020.04.001

[本文引用: 1]

JIANG

Y Y

， QU

G

， SUN

Z T

.

Machine learning assisted enzyme directed evolution

［J］. Journal of Biology， 2020， 37（4）： 1-11. DOI：10.3969/j.issn. 2095-1736.2020.04.001

[本文引用: 1]

[10]

MOSELEY

L G

.

Introduction to machine learning

［J］. Engineering Applications of Artificial Intelligence， 1988， 1（4）： 334. DOI：10.1016/0952-1976（88）90057-7

[本文引用: 1]

[11]

CADET

F

， FONTAINE

N

， LI

G Y

， et al.

A machine learning approach for reliable prediction of amino acid interactions and its application in the directed evolution of enantioselective enzymes

［J］. Scientific Reports， 2018， 8（1）： 16757. DOI：10. 1038/s41598-018-35033-y

[本文引用: 1]

[12]

FONTAINE

N

， CADET

F

.

Method and electronic system for predicting at least one fitness value of a protein， related computer program product

U.S. Patent Application 15/565，893［P］. 2018-04-05.

[本文引用: 1]

[13]

CADET

F

， FONTAINE

N

， VETRIVEL

I

， et al.

Application of fourier transform and proteochemometrics principles to protein engineering

［J］. BMC Bioinformatics， 2018， 19（1）： 382. DOI：10.1186/s12859-018-2407-8

[本文引用: 1]

[14]

FONTAINE

N

， CADET

F

， VETRIVEL

I

.

Novel descriptors and digital signal processing-Based method for protein sequence activity relationship study

［J］. International Journal of Molecular Sciences， 2019， 20（22）： 5640. DOI：10.3390/ijms20225640

[本文引用: 1]

[15]

OSTAFE

R

， FONTAINE

N

， FRANK

D

， et al.

One-shot optimization of multiple enzyme parameters： Tailoring glucose oxidase for pH and electron mediators

［J］. Biotechnology and Bioengineering， 2020， 117（1）： 17-29. DOI：10. 1002/bit.27169

[本文引用: 1]

[16]

BÉJÀ

O

， ARAVIND

L

， KOONIN

E V

， et al.

Bacterial rhodopsin： Evidence for a new type of phototrophy in the sea

［J］. Science， 2000， 289（5486）： 1902-1906. DOI：10.1126/science.289.5486.1902

[本文引用: 1]

[17]

BROWN

L S

， JUNG

K H

.

Bacteriorhodopsin-like proteins of eubacteria and fungi： The extent of conservation of the haloarchaeal proton-pumping mechanism

［J］. Photochemical & Photobiological Sciences， 2006， 5（6）： 538-546. DOI：10.1039/b514537f

[本文引用: 1]

[18]

CLAASSENS

N J

， VOLPERS

M

， SANTOS

V A P M D

， et al.

Potential of proton-pumping rhodopsins： Engineering photosystems into microorganisms

［J］. Trends in Biotechnology， 2013， 31（11）： 633-642. DOI：10.1016/j.tibtech.2013.08.006

[本文引用: 1]

[19]

ENGQVIST

M K M

， MCLSAAC

R S

， DOLLINGER

P

， et al.

Directed evolution of Gloeobacter violaceus rhodopsin spectral properties

［J］. Journal of Molecular Biology， 2015， 427（1）， 205-220. DOI：10.1016/j.jmb.2014.06.015

[本文引用: 1]

[20]

COOLEY

J W

， TUKEY

J W

.

An algorithm for the machine calculation of complex Fourier series

［J］. Mathematics of Computation， 1965， 19（90）： 297-301. doi:10.1090/s0025-5718-1965-0178586-1

[本文引用: 1]

[21]

SHUICHI

K

， PITOR

P

， MARIA

P

， et al.

AAindex： Amino acid index database， progress report 2008

［J］. Nucleic Acids Research， 2008， 36（Database）： D202-D205. DOI：10.1093/nar/gkm998

[本文引用: 1]

[22]

BENSON

D C

.

Digital signal processing methods for biosequence comparison

［J］. Nucleic Acids Research， 1990， 18（10）： 3001-3006. DOI：10.1093/nar/18.10.3001

[本文引用: 1]

[23]

YANG

K K

， WU

Z

， BEDBROOK

C N

， et al.

Learned protein embeddings for machine learning

［J］. Bioinformatics， 2018， 34（15）： 2642-2648. DOI：10. 1093/bioinformatics/bty178

[本文引用: 1]

[24]

NWANKWO

N

， SEKER

H

.

Digital signal processing techniques： Calculating biological functionalities

［J］. Journal of Proteomics & Bioinformatics， 2011， 4（12）： 260-268. DOI：10. 4172/jpb.1000199

[本文引用: 1]

[25]

LEVITT

M

.

A simplified representation of protein conformations for rapid simulation of protein folding

［J］. Journal of Molecular Biology， 1976， 104（1）： 59-107. DOI：10.1016/0022-2836（76）90004-8

[本文引用: 3]

[26]

CEDANO

J

， ALOY

P

， PÉREZ-PONS

J A

， et al.

Relation between amino acid composition and cellular location of proteins

［J］. Journal of Molecular Biology，. doi:10.1006/jmbi.1996.0804

[本文引用: 2]

1997， 266（3）： 594-600. DOI：10.1006/jmbi.1996.0804 .

[本文引用: 2]

[27]

FINKELSTEIN

A V

， BADRETDINOV

A Y

， PTITSYN

O B

.

Physical reasons for secondary structure stability： Alpha-helices in short peptides

［J］. Proteins， 1991， 10（4）： 287-99. DOI：10.1002/prot.340100403 .

[本文引用: 1]

Protein secondary structure prediction using logic-based machine learning

1

1992

... 机器学习是数理统计和计算机科学的延伸，包含许多统计模型和计算机程序算法.1992年，MUGGLETON等^［1］运用机器学习算法预测蛋白质二级结构，将蛋白质的二级结构与机器学习的编码相关联.随着机器学习算法的逐渐成熟，出现了用于预测结构、折叠、结合甚至催化活性的新版本机器学习算法，其主要目的是处理有关突变体及其功能特性的积累信息.易华伟等^［2］基于蛋白质的氨基酸序列通过机器学习算法预测其稳定性.程淑萍等^［3］运用3种不同的机器学习算法预测非编码RNA和蛋白质之间的相互作用，提高预测的准确率.徐开琨等^［4］运用特征选择与机器学习算法研究生物蛋白质中的标志物，这对疾病的早期诊断和临床治疗等有重要意义.胡如云等^［5］介绍了机器学习在合成生物学领域的典型应用，如启动子预测、酶催化设计、代谢途径构建、基因线路设计等. ...

基于氨基酸序列和模拟结构预测蛋白质稳定性的研究进展

1

2017

... 机器学习是数理统计和计算机科学的延伸，包含许多统计模型和计算机程序算法.1992年，MUGGLETON等^［1］运用机器学习算法预测蛋白质二级结构，将蛋白质的二级结构与机器学习的编码相关联.随着机器学习算法的逐渐成熟，出现了用于预测结构、折叠、结合甚至催化活性的新版本机器学习算法，其主要目的是处理有关突变体及其功能特性的积累信息.易华伟等^［2］基于蛋白质的氨基酸序列通过机器学习算法预测其稳定性.程淑萍等^［3］运用3种不同的机器学习算法预测非编码RNA和蛋白质之间的相互作用，提高预测的准确率.徐开琨等^［4］运用特征选择与机器学习算法研究生物蛋白质中的标志物，这对疾病的早期诊断和临床治疗等有重要意义.胡如云等^［5］介绍了机器学习在合成生物学领域的典型应用，如启动子预测、酶催化设计、代谢途径构建、基因线路设计等. ...

基于氨基酸序列和模拟结构预测蛋白质稳定性的研究进展

1

2017

... 机器学习是数理统计和计算机科学的延伸，包含许多统计模型和计算机程序算法.1992年，MUGGLETON等^［1］运用机器学习算法预测蛋白质二级结构，将蛋白质的二级结构与机器学习的编码相关联.随着机器学习算法的逐渐成熟，出现了用于预测结构、折叠、结合甚至催化活性的新版本机器学习算法，其主要目的是处理有关突变体及其功能特性的积累信息.易华伟等^［2］基于蛋白质的氨基酸序列通过机器学习算法预测其稳定性.程淑萍等^［3］运用3种不同的机器学习算法预测非编码RNA和蛋白质之间的相互作用，提高预测的准确率.徐开琨等^［4］运用特征选择与机器学习算法研究生物蛋白质中的标志物，这对疾病的早期诊断和临床治疗等有重要意义.胡如云等^［5］介绍了机器学习在合成生物学领域的典型应用，如启动子预测、酶催化设计、代谢途径构建、基因线路设计等. ...

基于机器学习方法的非编码RNA-蛋白质相互作用的预测

1

2019

... 机器学习是数理统计和计算机科学的延伸，包含许多统计模型和计算机程序算法.1992年，MUGGLETON等^［1］运用机器学习算法预测蛋白质二级结构，将蛋白质的二级结构与机器学习的编码相关联.随着机器学习算法的逐渐成熟，出现了用于预测结构、折叠、结合甚至催化活性的新版本机器学习算法，其主要目的是处理有关突变体及其功能特性的积累信息.易华伟等^［2］基于蛋白质的氨基酸序列通过机器学习算法预测其稳定性.程淑萍等^［3］运用3种不同的机器学习算法预测非编码RNA和蛋白质之间的相互作用，提高预测的准确率.徐开琨等^［4］运用特征选择与机器学习算法研究生物蛋白质中的标志物，这对疾病的早期诊断和临床治疗等有重要意义.胡如云等^［5］介绍了机器学习在合成生物学领域的典型应用，如启动子预测、酶催化设计、代谢途径构建、基因线路设计等. ...

基于机器学习方法的非编码RNA-蛋白质相互作用的预测

1

2019

... 机器学习是数理统计和计算机科学的延伸，包含许多统计模型和计算机程序算法.1992年，MUGGLETON等^［1］运用机器学习算法预测蛋白质二级结构，将蛋白质的二级结构与机器学习的编码相关联.随着机器学习算法的逐渐成熟，出现了用于预测结构、折叠、结合甚至催化活性的新版本机器学习算法，其主要目的是处理有关突变体及其功能特性的积累信息.易华伟等^［2］基于蛋白质的氨基酸序列通过机器学习算法预测其稳定性.程淑萍等^［3］运用3种不同的机器学习算法预测非编码RNA和蛋白质之间的相互作用，提高预测的准确率.徐开琨等^［4］运用特征选择与机器学习算法研究生物蛋白质中的标志物，这对疾病的早期诊断和临床治疗等有重要意义.胡如云等^［5］介绍了机器学习在合成生物学领域的典型应用，如启动子预测、酶催化设计、代谢途径构建、基因线路设计等. ...

基于质谱的蛋白质生物标志物发现中的特征选择与机器学习方法研究进展

1

2019

... 机器学习是数理统计和计算机科学的延伸，包含许多统计模型和计算机程序算法.1992年，MUGGLETON等^［1］运用机器学习算法预测蛋白质二级结构，将蛋白质的二级结构与机器学习的编码相关联.随着机器学习算法的逐渐成熟，出现了用于预测结构、折叠、结合甚至催化活性的新版本机器学习算法，其主要目的是处理有关突变体及其功能特性的积累信息.易华伟等^［2］基于蛋白质的氨基酸序列通过机器学习算法预测其稳定性.程淑萍等^［3］运用3种不同的机器学习算法预测非编码RNA和蛋白质之间的相互作用，提高预测的准确率.徐开琨等^［4］运用特征选择与机器学习算法研究生物蛋白质中的标志物，这对疾病的早期诊断和临床治疗等有重要意义.胡如云等^［5］介绍了机器学习在合成生物学领域的典型应用，如启动子预测、酶催化设计、代谢途径构建、基因线路设计等. ...

基于质谱的蛋白质生物标志物发现中的特征选择与机器学习方法研究进展

1

2019

... 机器学习是数理统计和计算机科学的延伸，包含许多统计模型和计算机程序算法.1992年，MUGGLETON等^［1］运用机器学习算法预测蛋白质二级结构，将蛋白质的二级结构与机器学习的编码相关联.随着机器学习算法的逐渐成熟，出现了用于预测结构、折叠、结合甚至催化活性的新版本机器学习算法，其主要目的是处理有关突变体及其功能特性的积累信息.易华伟等^［2］基于蛋白质的氨基酸序列通过机器学习算法预测其稳定性.程淑萍等^［3］运用3种不同的机器学习算法预测非编码RNA和蛋白质之间的相互作用，提高预测的准确率.徐开琨等^［4］运用特征选择与机器学习算法研究生物蛋白质中的标志物，这对疾病的早期诊断和临床治疗等有重要意义.胡如云等^［5］介绍了机器学习在合成生物学领域的典型应用，如启动子预测、酶催化设计、代谢途径构建、基因线路设计等. ...

面向合成生物学的机器学习方法及应用

1

2021

... 机器学习是数理统计和计算机科学的延伸，包含许多统计模型和计算机程序算法.1992年，MUGGLETON等^［1］运用机器学习算法预测蛋白质二级结构，将蛋白质的二级结构与机器学习的编码相关联.随着机器学习算法的逐渐成熟，出现了用于预测结构、折叠、结合甚至催化活性的新版本机器学习算法，其主要目的是处理有关突变体及其功能特性的积累信息.易华伟等^［2］基于蛋白质的氨基酸序列通过机器学习算法预测其稳定性.程淑萍等^［3］运用3种不同的机器学习算法预测非编码RNA和蛋白质之间的相互作用，提高预测的准确率.徐开琨等^［4］运用特征选择与机器学习算法研究生物蛋白质中的标志物，这对疾病的早期诊断和临床治疗等有重要意义.胡如云等^［5］介绍了机器学习在合成生物学领域的典型应用，如启动子预测、酶催化设计、代谢途径构建、基因线路设计等. ...

面向合成生物学的机器学习方法及应用

1

2021

... 机器学习是数理统计和计算机科学的延伸，包含许多统计模型和计算机程序算法.1992年，MUGGLETON等^［1］运用机器学习算法预测蛋白质二级结构，将蛋白质的二级结构与机器学习的编码相关联.随着机器学习算法的逐渐成熟，出现了用于预测结构、折叠、结合甚至催化活性的新版本机器学习算法，其主要目的是处理有关突变体及其功能特性的积累信息.易华伟等^［2］基于蛋白质的氨基酸序列通过机器学习算法预测其稳定性.程淑萍等^［3］运用3种不同的机器学习算法预测非编码RNA和蛋白质之间的相互作用，提高预测的准确率.徐开琨等^［4］运用特征选择与机器学习算法研究生物蛋白质中的标志物，这对疾病的早期诊断和临床治疗等有重要意义.胡如云等^［5］介绍了机器学习在合成生物学领域的典型应用，如启动子预测、酶催化设计、代谢途径构建、基因线路设计等. ...

Design and evolution of enzymes for non-natural chemistry

1

2017