欢迎关注我的微信公众号【万能的小江江】
MHCflurry命令行教程
指定模型
结果
结合亲和力预测以nM中的亲和力(KD)表示在该 mhcflurry_affinity
列中。较低的值表示较强的粘合剂。具有合理免疫原性的肽的常用阈值为500 nM
在mhcflurry_affinity_percentile
给出在大量对等位基因测试随机肽的亲和力预测的百分位数(范围0 - 100)。越低越强。2%是常用阈值。
mhcflurry_presentation_score,mhcflurry_presentation_percentile给出了抗原加工和呈递分数。这些范围从0到1,值越高表明处理或呈现效果越好
泛等位基因模型The pan-allele models
MHCFLURRY_OPTIMIZATION_LEVEL
The pan-allele models can be somewhat slow. As an optimization, when this variable is greater than 0 (default is 1), we “stitch” the pan-allele models in the ensemble into one large tensorflow graph. In our experiments it gives about a 30% speed improvement. It has no effect on allele-specific models. Set this variable to 0 to disable this behavior. This may be helpful if you are running out of memory using the pan-allele models.
泛等位基因模型可能会变慢。作为优化,当此变量大于0(默认值为1)时,我们将集合中的泛等位基因模型“缝合”到一个大的张量流图中。在我们的实验中,速度提高了约30%。它对等位基因特异性模型没有影响。将此变量设置为0可禁用此行为。如果使用泛等位基因模型的内存不足,这可能会有所帮助。
Python库教程
Class1PresentationPredictor
包装实例
Class1AffinityPredictor
产生结合亲和力预测
Class1ProcessingPredictor
产生抗原加工预测
使用结合亲和力和处理预测的逻辑回归模型计算表达得分
MHCFLURRY_OPTIMIZATION_LEVEL?
则应该提供肽源蛋白的上游(N侧)和下游(C侧)序列,以提高准确性。为此,请指定n_flank
和c_flank
参数
主要S3的table download下来(将近75万行)hits()和decoys(自动生成的)(可以帮助理解)
一部分holdout 一部分training