AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架
  24eTNZKd6a8S 2023年12月23日 72 0

关键词:
作者:Wen-Feng Zeng 1 , Xie-Xuan Zhou1 , Sander Willems1 , Constantin Ammar1
期刊:nature communications
年份:2022
论文原文:https://doi.org/10.1038/s41467-022-34904-3补充材料:
41467_2022_34904_MOESM1_ESM(科研通-ablesci.com).pdf(2.2 MB)

主要内容

问题

机器学习,尤其是深度学习 (DL) 在基于质谱 (MS) 的蛋白质组学中越来越重要。AlphaPeptDeep,这是一个构建在PyTorch DL库基础上的模块化Python框架,它可以学习和预测多肽的属性。

AlphaPeptDeep以通用的方式表示翻译后修饰,即使只有化学组成是已知的。用于预测保留时间(RT)、碰撞截面(CSS)和碎片强度的AlphaPeptDeep模型至少与现有工具相当。

其他基于序列的特性也可以通过AlphaPeptDeep进行预测,正如通过改进与数据无关的获取的HLA多肽识别模型所展示的那样


方法

AlphaPeptDeep框架

为了开发 AlphaPeptDeep,我们构建了一个名为 AlphaBase 的基础设施包,其中包含蛋白质、肽、PTM 和光谱库的许多必要功能。

在 AlphaBase 中,我们使用 pandas DataFrame 作为基础数据结构,它允许以表格格式进行数据处理。AlphaPeptDeep 使用 AlphaBase DataFrames 作为输入来构建模型并预测肽的属性。氨基酸和 PTM 嵌入直接从肽 DataFrame 中的“sequence”(氨基酸序列)、“mods”(修饰名称)和“mod_sites”(修饰位点)列执行。

PREDICTPEPTIDESPROPERTIES食SEQUENCESPEPTIDES[2.3,... 5.7]PEPTIDAIJILPIEPPT.L.D[3.3,..4.2]PEPTIDB[2.3, 7.6]PEPP TIDC[8.3,... 7.6]ALPHAPEPT DEEPINCREASE LDENTIFICATIONSENSITIVILY IACCURACYBDATAFRAMEDATAFRAMESAVETRAINEMBEDDINGPREDICTBUILDCCS MS2TRANSFOMERCUSTOMRT-LSTM/GRUCUSTOMBUILDEMBEDDINGTRAINWARM-UP TRAININGCIFFERENT NN ARCHITECTURES:AMINO ACID EMBEDDINGLSTM,TRANSFORMER.CNNTRANSFER LEARNINGCOMPOSITION-BASEDBATCHIFYING THE DATAPTM EMBEDDINGCUSTOMIZED ARCHITECTURES"SWITCHING BETWEEN GPU AND CPUMETA EMBEDDINGCCS MS2RT-CUSTOMPREDICTSAVEPRE-TRAINED RTICCSMS2 PREDICTION MODELSLEAMED WEIGHTSRE LEASING GPU RAM'SOURCE CODES OF THE MODELEXISTING REGRESSION AND DA SS IICATIONAFTER PREDICTION'MULLIPROCESSING WITHOUT GPUHYPER-PARAMETERSMODULES FROM THE MODEL SHOP INALPHAPEPTDEEP"CUSTIMIZING MODELS USING OUR APIS

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_数据集


AMINO ACID EMBEDDING一个序列的每个氨基酸部被转换成一个唯一的整数,和C端以及其他填充位置使用零作为填充值.:ENCODER用于将每个整数映射到一个包含0和1的27维向量.使用线性层将这些向量映射到N"ONE-HOTQ维嵌入向量SEQENCEPEPTIDEPHACCARCOMPOSITION-BASED PTM EMBEDDINGONE-HOTAA IDEMBEDDED TENSOR32820123D1[E,0,0,.....0]#C#H#ND2#O#S#PPADDING甲[1,0,0,.....0][0,1,0,....,0][0,0,1,......0]LINEAR LAYERTORCH.EMBEDDING[E,0,0,.....1,0]Y:25#NA#CA#MG#FEALL OTHER ELEMENTSZ:26[0,0,0,....1]&CONCATENATE AT THE LAST DIMENSION

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_数据集_02


PTMEMBEDDING对于PTM,我们使用6-D嵌入向呈来表示C,H,N,O,S和P原子.PTM的所有其他原子都嵌入到具有完全连接(FC)层的二维向量中.6-D和2-D向量连接成一个8-D向量来表示PTMMS2 MODEL, RT MODEL, CCS MODELRT/CCSMS2 INTENSITIES(B+,B+,Y+,Y++++)SCALAR4 X TRANSFORMER LAYER2X BILSTM LAYERPOSITIONAL ENCODING1 X CNN LAYERMETA EMBEDDINGPTM EMBEDDINGAA EMBEDDING中MS2:CHARGE,NCE,INSTRUMONTCCS:CHARGECSDN@唐小星小宇宙:CONCATENATE AT THE LAST DIMENSION

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_数据集_03


MS2MODEL:MS2模型由一个嵌入层,位置编码器层和四个变换器层以及两个FC层组成.嵌入层:嵌入氨基酸序列和修饰,还嵌入元数据(如有必要),包括电荷状态,归一化碰撞能呈和仪器类型.所有这些嵌入的张量都连接到下一层.添加了一个额外的TRANSFORMER层来预测"MODLOSS",它指的是PTM的中性损耗强度RTMODEL:RT模型由一个用于序列和修改的联入层,一个CNN 层和后面两个隐裁层大小为128的BLSTM,层组成.最后一个LSTM层的输出在肽长度维度上求和并由两个FC层处理输出大小为64和1.CCSMODEL:CCS模型包含一个用于序列,修改和电荷状态的嵌入层,以及一个CNN层和两个LSTM层,隐藏是大小为128.最后一个LSTM层的输出在肤长度维度上求和并由两个FC层,输出大小为64和1.模型参数总数为713452.HLA PREDICTION MODELHLA预测模型由一个序列嵌入层,一个CNN层和两个隐藏层大小为256的LSTM层组成.最后一个LSTM层的输出在序列长层维度上家和,并由两个线性层处理,输出大小为64和1.将SIGMOID激应用于最后一个线性层以获得概率.到14的已识别HLA肽被视为阳性样本.阴性样本是从与HLA肽具有相对于训练和迁移学习,序列长度为8到14同长度分布的人类蛋白质序列中随机挑选的.

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_迁移学习_04


主要实验及结果

ALPHAPEPTDEEP概述和模型训练APHAPEPIDEEP框架的目标;能够轻松构建和训练深度学习(DL)模型,在提供足够训练数据的情况下实现高(性能.我们设计了一个通用的培训界面,允许用户只使用一行PYTHON代码来培训模型-MODELTRAING.在我们的训练界面中,我们还提供了一种热身训练策路(WAMUP),为不同的训练时期(方法安排学习速度.事实证明.这在不同的任务中非常有用,以减少早期训练阶段的偏差.为了构建新模型,ALPHAPEPTDEEP提供换决化应用程序编程接口(API)以使用不同的神经网络架构.(LSTM,CNN,TRANSTORMERS),我们的框架还可以轻松地为不同的预测任务组合不同的神经网络架构.)框架最重要的功能是预测给定目标肽的特性.仅使用CPU时,可以选择多处理(使用多个ALPHAPEPTDEEP框架量CPU内核进行预则),使得预测速度在普通个人计算机和笔记本电脑上可以接受(整个审查的人类蛋白质组)将近2小时).在我们的数据集和硬件上,GPU上的预测速度快了一个数量级.ALPHAPEPTDEEP 在'MODEL SHOP 模块中提供了几个基于 RANSFORMERS和LSTM架构的模型模板来开发新的DL模型,并且还允许从头开始选择超参数以使用很少的代码进行分类或回归.

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_数据_05


ALPHAPEPTDEEP 模型对 MS2 (FRAGMENTA-TION SPECTRA) 谱图的预测性能第一阶段:首先将MS2楼型与胰蛋白酶肽数据集进行基准测试,训练和测试数据是从各种仪器和碰撞能星中收集的.将数据集一分为二,并在类以于PDEEP的LSTM模型或新的TRANSFORMER模型上进行训练.训练学习参数:EPOCH-100,WARMUP EPOCH-20,学习率(IR)-1E-5,DROPOUT-0.1LSTM:TRYPTICTRANSFOMER:TRYPTIC120%6%788.5%100%80%PCC9060%28.3%40%20%0%PXD014525-PHOSPXD019347-PHOSPT2-25-30-35PXD019086-DROSOPHILAPT-SRMATLAS(TIMSTOF)PT-HLA-20-23PXD026824-PHOSPXD021318-PHOSPT1-25-30-35PXD019086-ECOLIPT2-28PT1-20-23(TIMSTOF)PT2-20-23PT-MISSINGGENESPXD004452-GLUCPXD000138-PHOSPXD004452-TRYPPT-HLA-25-30-35PT-HLA-28(TIMSTOF)PXD019086-LYSCPXD004452-LYSCPXD004452-CHYMOPXD019854-DIGLYCSDN@唐小星小宇宙

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_数据集_06


第二阶段:将同样来自PROLEOMETOOLS的合成HLA数据纯附加到第1阶段的训练集中,并对捷型进行额外/20个8POCHSBS)练(微润换型)训练参数: EPOCH-20, WARMUP EPOCH-5, IR-1E-5, DROPOUT-0.1, MINI-BATCH SIZE-256第三阶段:我们扩展了我们的模型以预测磷酸化和泛素化肽,并且只考虑局部概率>0.75的磷酸化位点训练参数: EPOCH-20, WARMUP EPOCH-5, IT-1E-5, DROPOUT-0.1, MINI-BATCH SIZE-256.在第3阶段对PTM数据集进行训练后,性能显着提高,几乎达到胰蛋白酶肽的水平.APHASE 1:TRYPTICPHASE 2:HLAPHASE 3 :PTM-EXPERIMENTAL REPLICATES95%PTMTIMSTOFQ-EXACTIVEHLAPROTEOMETOOLS100%90%80%PCC9060%40%20%0%PXD019086-LYSCPXD004452-TRYP(TIMSTOF)PXD014525-PHOS-PXD004452-LYSCPT-HLA-28PXD004452-GLUCPXD019086-ECOLI-PXD019347-PHOS-PXD000138-PHOS-PXD021318-PHOSPT-HLA-25-30-35PT2-20-23PXD004452-CHYMO-PT-HLA-20-23PT-MISSINGGENESPXD019086-DROSOPHILA-PT1-25-30-35PXD026824-PHOS-PT2-25-30-35PT2-28-(TIMSTOF)PT-SRMATLASPT1-20-23PXD019854-DIGLY(TIMSTOF)唐小星小宇CSDN

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_迁移学习_07


注:PCC90:匹配PSM的预测片段强度与测量片段强度的PEARSON相关系数(PCC)至少为90%X轴:测试数据集的名称前缀"PT":PROTEOMETOOLS.PT1和PT2:分别指PROTEOMETOOLS第I部分和第|I 部分.RT (RETENTION TIME)和CCS(COLLISION CROSS SECTION)的 ALPHAPEP 模型的预测性能输入:肽序列和PTM输出:标量值通过降以每个LC程度的时间长座对陈教授结中PSM的所有RT值进行旧一化,从而得到范围从0到1的日一化RT值.因此,预测的RT也被归一化.

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_数据_08


TABLE 1|DATASET INFORMATION USED TO TRAIN AND TEST RT/CCS MODELSDATASETDESCRIPTIONMODIFICATIONSSEARCHUSAGERT MODELTRYPSIN AND LYSC HELA PEPTIDES.REF.26HELATRAININGMAXQUANTREGULARPHLPAN HUMAN LIBRARY. REF.57TESTINGREGULARPHOS-U2OSPHOSPHOPEPTIDES OF U2OS. REF. 58TESTINGSPECTRONAUTREGULAR AND PHOSCCS MODELHELAMAXQUANTSAME AS HELA IN RT SECTIONTRAININGREGULARE. COLI PEPTIDES.REF.26TESTINGMAXQUANTE.COLIREGULARYEAST PEPTIDES.REF.26TESTINGMAXQUANTYEASTREGULARSAME AS HELA IN RT SECTION.ONLY PEPTIDES WITH NONREGULARTESTINGOPEN-PFINDHELA-OPENALL POSSIBLE PTMSMODIFICATIONS WERE KEPT AFTER OPEN-SEARCH FOR TESTINGDROSOPHILA-OPENDROSOPHILA PEPTIDES.REF.26.ONLY PEPTIDES WITH NONREGULAROPEN-PFINDALL POSSIBLE PTMSTESTINGMODIFICATIONS WERE KEPT AFTER OPEN-SEAFCH TES!星小星小宇宙在PHL数据本中的规则队大上海过了引起了RT楼里;预先引擎的楼型在大部分RT范国内给出了非常河的预测,但未能准确地预测量后几分钟(对于RT预测,少样本学习可以纠正不同LC条件之间的RT偏差.)

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_迁移学习_09


TEST RT MODEL:PAN-HUMAN-LIBRARYTEST CCS MODEL:REGULAR PEPTIDES800R20.983R?0.986R20.984R20.927R0.992150PRE-TRAINED600FINE-TUNEFINE-TUNE100CCS#500#7819850400+E.COLIYEAST#TEST156396-50200-150-25050150400009200400200800600TEST CCS MODEL:UNEXPECTED PTMSTEST RT MODEL :PHOSPHO(U2OS)800-R20.965R0.953150R20.958R20.989R20.984100 PRE-TRAINEDFINE-TUNEFINE-TUNE600-#25391#500CCS50DROSOPHILAHELA-50#TEST 50783200K800150-50812515050400200600PREDICTED CCSSDN @唐小星小宇宙PREDICTED IRT

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_迁移学习_10


21个带迁移学习的PTM(翻译后修饰) 的预测性能为了进一步证明ADHAPEPEPSEP对PTM的理大而灵活的交持,本文使用基于200个模板队系列合成的21个PTM测试了预引练的款蛋.白酶MS2模型和RT模型;A# TUNING SEQS-10#TUNING SEQS 50# TUNING SEQS80% OF ALL SEQSPRE-TRAINED100%90%80%PCC9060%40%20%0%FORMYL@KDIMETHYL-SYM@RPROPION@KCROTONYL@KDIMETHYL-AS@RBIOTIN@KACETYL@KMETHYL@RDIMETHYL@KPHOSPHO@YGLUTARYL@KHYDROXY@KBUTYRYL@KUNMOD@KTRIMETHYL@KUNMOD@RHYDROXYPRO@P.CITRULLIN@RSUCCINYL@KMETHYL@KGLYGLY@KMALONYL@KUNMOD@PUNMOD@YNITROTYR@YCSDN@唐小星小宇宙使用10或50个具有不同电有机态和磁格思维护通用于31110类型应用于移学习,保留具有相同PIM的对到年以用于测过程的半习到的迁移;

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_数据集_11


CAGPNASIISLKSDK-BIOTIN@K-11(2+)100%B IONS Y IONSPCC0.623Y5+80%B8+60%5E5PCC90PREDICTED(PRE-TRAINED)INTENSITY40%PCC-0.9875E5三二二20%0-5E5PREDICTED(FINE-TUNED#50)RAW 02330A.GC3.3991.05 PTM. TRAINKE KMOD BLOTINY 200FMOL 3XHCD R1SCAN 30833PRE-TRAINED #50 #80%140CSDN@唐小星小宇宙200040060012001000800M/Z迁移学习的强大功能,我们的模型可以适应新情况,只需很少的额外数据.(使用了21个PTM的数据提测试了致训练RT模型的性能.尽管该模型从未在任何这些PTM上进行过训练,但对这些肽的RT预测准确性超过了DEEPLC37.DEEPLCTRANSFERPRE-TRAINED1.00.98R (RT OF EXP.VS PRED.)0.8R?(RT OF EXP.VS PRED.)0.950.920.890.20.860.00.83DIMETHYL@K-FORMYL@KDIMETHYL-SYM@RGLYGLY@KGLUTARYL@KBUTYRYL@KCROTONYL@KMETHYL@RHYDROXY@KDIMETHYL-AS@RSUCCINYL@KTRIMETHYL@KMALONYL@KACETYL@KCITRULLIN@RNITROTYR@Y.BIOTIN@KPROPION@KMETHYL@KUNMOD@KUNMOD@YPHOSPHO@YUNMOD@RUNMOD@PHYDROXYPRO@P0.80TRANSFERDEEPLCPRE-TRAINEDCSDN@唐小星小宇宙

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_数据集_12


促进HLA肽的数据依赖采集(DDA)鉴定HLA跃是基于MS的蛋白质组学中最是挑战战生的样品之一,鉴于APHAPEPIDEEP中HANSLOMES出色的校型性貌,假及预测MS2光谱可以大大提高HLA肽的鉴定.使用MS2,RT和CCS预测交持HA队鉴定的关键思想是,对于搜索光谱的正强跃,预测的特性应该非带提近控测到的特性,而无关放的预测特位往往往是随机分布,因此,预测和保质同件之同的相以速不同可以用作机遇学习特征,以使用半监督学习来区分正确和音误的R别.ALPHAPEPTDEEP现在能够预测任意修饰肽的特性,甚至是具有意外PTM的HLA肽.将ALPHAPEPTDEEP结果与MAXQUANT以及PROSIT进行比较在单等位数倍0了解放招集上, APHAPEPIDSEP 最着了 93%和 96%的 MAXQUANT结果,同时在1% 以上与PROST相比,AIPHAPEPIDEEP捕获了他们91%的肽,并且仍然将单等位基因数据集的总数提高了7%.

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_数据_13


ATUMORMONO-ALLELICMAXQUANT W/MAXQUANT(IAA)WLMAXQUANT(IAA)W/MAXQUANTW/ALPHAPEPTDEEPPROSIT RESCOREPROSIT RESCOREALPHAPEPTDEEPRESCORERESCORE143706147821469129281042336980818833878185806731106847024297131MAXQUANT(IAA)MAXQUANTBMONO-ALLELIC OPEN-SEARCHTUMOR OPEN-SEARCH200175PFIND WL ALPHAPEPTDEEP GAINPFIND W/ ALPHAPEPTDEEP GAINOVERIAPOVERLAP175LOSS (PFIND ONLY)LOSS(PFIND ONLY)150一期悠MHAL43%-41%-PERCENTAGE TO OVERLAP(%)125PERCENTAGE TO OVERTAP(%)93.72381,76511,95894%二24%26%二081485.47339,82934,356100%二100%二100%-100%二100%100%-199.76816,850216,618145.003150,8205,817252500UNEXPESES品件UNEXPECTED PTMSALL PEPTIDESREGULAR PEPTIDESALL PEPTIDESREGULAR PEPTIDESREGULAR PEPTIDES:指未经修饰的肽或仅经过MET.氧化和CYS-烷基化的肽DDA:数据依赖性采集DIA:数据非依赖性采集

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_数据_14


为HLA DIA搜索构建HLA预测模型DA已成为生成大规模蛋白质组数据生的首选方法.DA放据分析传统上需要DDA买输来生成一个库,然后将数据与之四配.使用来自蛋白质组学习日S(AILAINAN进行分行化使用这验住址AAY进行分行更是护的RDEEP 相识中的PEPSHOQ"功能为建了一个HA预测模型,在该镜型中,二元LSTM分谈路预测给定序列是否可能是星现给免疫系统的HLA队,并从人类至.白质组序列中提取这些肽.该模型主要有两个目标:(1)高灵敏度(2)高高特异性基于这些目标,我们开发了一个模型,可以预测DIA数据的库搜索.分为五个步骤:1.使用来自己知HLA等位基因类型的跃门陈了一个泛HLA预测楼型:(来自给是个体样本中通第存在多达6种不同的等位基因类2.使用迁移学习来创理一个特定于人的接理,该接望具有从个体识别的特定于样本的各肽;(预测样本中是百存在资在的HLA各肽.从而进一步减少要搜索的多肽的数量,并提高预测的准确性)3.使用样本特定模型直接从蛋白质序列数据库中预测所有可能的个性化的HLA多肽;4.预测的HLA肽用于通过使用APHAPEPTDEEP生成预测的光谱库,然后使用DIA搜索引擎通过DIA数据进行识别.

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_迁移学习_15


SAMPLE-SPECIFICPROTEIN SEQUENCELARGE-SCALE PUBLICHLA PEPTIDESDATABASES(FASTA)HLA PEPTIDESALPHAPEPTDEEPMS2/CCS/RT MODELSHLAPREDICTION MODELLSTM BUILT ONALPHAPEPTDEEPS PRESENTED HLASEGUENCEPREDICTEDPREDICTEDSAMPLE-SPECIFICPAN-HLA MODELDIA ANALYSISHLA PEPTIDESSPECTRALTRANSFERTRAINPREDICTDIGESTACDEFMODELLIBRARYFROM FASTALIBRARYAND?PQRSTYCSDN@唐小星小宇宙PREDICT发现:在没有迁移学习的情况下直接在直接DIA肽上进行训练导致的肽只比迁移学习略少推断原因;每个个体的基序不多,仅从改于个HLA肽中学习序列颜式区该是直接的.这将有助于识别未如的样态特异生HLA等位基因类型,因为我们不需要任何先验知识.但是如果我们只有少量训练肽和未知等位基因类型,迁移学习仍然是必要的.实验证明;从94科等位基因类型中去除了HAA.A.68.0185所有肽,并使用其余部分来训练新的PAN,HA模型.这些味管样品中的所有HLA.68.01肽部不知道.然后我们仅使用100HLA-A?68.01和所有非HLAA"68.01肽,这些肽由直接DIA识别并由.MXMHCPIED解发积以进行迁格学习,生成的库随后识别出29331个肽段,其中7,868个来自HLAA`68.01(使用1000个HAA*68:01肽段进行的迁移学习几乎检索到了所有肽段.

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_迁移学习_16


DDA(OPEN-PFIND+ALPHAPEPTDEEP)TRANSFER LEARNING WITH A6801DIA-UMPIRE/AS AN UNKNOWN HLA TYPE12000SEQUENCESPEAKS-ONLINE10000ALPHAPEPTDEEP LIBALPHAPEPTDEEP LIB (NO PRETRAIN)8000-ALPHAPEPTDEEP LIB (A68011000)6000ALPHAPEPTDEEP LIB (A6801 100)S#40002000-010%FREQUENCY20%-30%40%C1402B3901A0220-C0702B1501A0101-A0201C0401C1203TRASHB3503B0702CSDN@唐小星小宇宙HLA TYPE

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_迁移学习_17



结论

主要工作:本研究开发了一个名为APHAPEPTDEEP的深度学习框架,它统一了高级功能来引练,迁移学习和使用模型进行跃特性预测;基于这些功能,我们构建了MS2,RT和CCS模型,从而能够预测多种不同的PTM类型;,提供了一个名为'MODELSHOP"的模决,其中包含通用模型,以便用户只需几行代码即可从头开始开发新模型;建立了一个HLA预测模型来预测一个肽序列是否是一个呈递的HLA肽;亮点总结:1.提供开源模块化,可拓展化ALPHAPEEPTDEEP框架,方便研究者直接使用.2.通过迁移学习,可拓展ALPHAPEPTDEEP框架多肽预测范围,满足研究者个性化需求.

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_数据_18


目前存在的一些问题:本研究自接从整个人类照白质用预测HLA酒车,并使用HLADIA数据对具进行程束,使用我们预测的年优于现有的DDA工作流程.这并不能证明DIA在HLA肽组分析中总是优于DDA,因为DDA蛋白质组数据库比我们预测的DA分析库大20倍.尽管AIPHAPEPTDEEP既虽大又易于使用,但我们注意到传统的机器学习问题,例如框架中的过度拟合解决方案:如果未来的DDA搜索引擎支持预测的库搜索,它们可能能够识别更多的肽;尝试不同的超参数(例如以练时期的EPOCHS)仍然是必要的.不同的小批最大小和学习率也可能影响模型训练;APHAPOPIDEOP能够最大限应地减少年A专家的研究人员从头于始成在我们陈模型之上构理自己的模型的挑战,队招生预测可以涉及几乎所有步骤,以改进计算蛋白质组学工作流程.除了基于MS的蛋白质组学感兴趣的特定属住外,它原则上可用于解决肽两性是苏基预序列各数的任何问题,正如我们通过成功预测造在的HLA款以领取汽车搜索泡图所正明的用BB年,因此,有了足够可能的打练数据,APHAPAPDOOP将可能成为而白质组学的至要深度学习资源.

AlphaPeptDeep:用于预测蛋白质组学肽特性的模块化深度学习框架_迁移学习_19




【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年12月23日 0

暂无评论

推荐阅读
24eTNZKd6a8S