Bio.SearchIO. InterprosanIO包

子模块

模块内容

Bio.SearchIO支持InterProScan输出格式。

此模块添加了对解析InterProScanML输出的支持。InterProScan可作为命令行程序或在EmbL-EBI的网页上提供。Bio.SearchIO. InterprosanIO在以下版本上进行了测试:

  • 版本:5.26-65.0(interprosan-model-2.1.xSD)

有关InterProScan的更多信息可通过以下链接获取:-出版物:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3998142/- Web界面:https://www.ebi.ac.uk/interpro/search/sequence-search-文档:https://github.com/ebi-pf-team/interproscan/wiki

支持的格式

Bio.SearchIO. InterprosanIO支持以下格式:

  • XML - “interprosan-html”-解析

interproscan-xml

interproscan-html解析器遵循此处描述的InterProScanML:https://github.com/ebi-pf-team/interproscan/wiki/OutputFormats

对象

属性

XML元素

QueryResult

目标

InterPro

程序

InterProScan

版本

protein-matches.interproscan-version

击中

加入

signature.name

ID

signature.ac

描述

signature.desc

dbxref

IPR:entry.ac go-xref.id pathway-xref.db:pathway-xref.id

attributes ['Target'] ['Target version'] ['Hit type']

*-match / *-location signature-library-release.library signature-library-release.version

HSP

位得分

*-location.score

evalue

*-location.evalue

HSPFragment(也通过HSPs)

query_start

*-location.start

query_end

*-location.end

hit_start

*-location.hmm-start

hit_end

*-location.hmm-end

查询

sequence

InterProScanML文件可能包含具有多个位置的匹配项或具有单个位置的同一蛋白质的多个匹配项。在这两种情况下,匹配都被唯一存储为UTE对象,位置被唯一存储为SPP对象。

HSP.*start == *start - 1 (由于Biopython中每个开始位置都是以0为基础)

HSP.aln_span ==  query-end - query-start

匹配的类型或地点(例如hmmer 3-match、hmmer 3-location、coils-match、panther-location)存储在hit. attractments中 ['Hit type'] .例如,对于每一场“恐惧匹配”,都会有一个“恐惧位置”。因此,Hit. ype将存储不包括“-match”或“-location”(在本示例中为“phobious”)的字符串。