Bio.SearchIO. InterprosanIO包
子模块
模块内容
Bio.SearchIO支持InterProScan输出格式。
此模块添加了对解析InterProScanML输出的支持。InterProScan可作为命令行程序或在EmbL-EBI的网页上提供。Bio.SearchIO. InterprosanIO在以下版本上进行了测试:
版本:5.26-65.0(interprosan-model-2.1.xSD)
有关InterProScan的更多信息可通过以下链接获取:-出版物:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3998142/- Web界面:https://www.ebi.ac.uk/interpro/search/sequence-search-文档:https://github.com/ebi-pf-team/interproscan/wiki
支持的格式
Bio.SearchIO. InterprosanIO支持以下格式:
XML - “interprosan-html”-解析
interproscan-xml
interproscan-html解析器遵循此处描述的InterProScanML:https://github.com/ebi-pf-team/interproscan/wiki/OutputFormats
对象 |
属性 |
XML元素 |
---|---|---|
QueryResult |
目标 |
|
程序 |
|
|
版本 |
|
|
击中 |
加入 |
|
ID |
|
|
描述 |
|
|
dbxref |
|
|
attributes ['Target'] ['Target version'] ['Hit type'] |
|
|
HSP |
位得分 |
|
evalue |
|
|
HSPFragment(也通过HSPs) |
query_start |
|
query_end |
|
|
hit_start |
|
|
hit_end |
|
|
查询 |
|
InterProScanML文件可能包含具有多个位置的匹配项或具有单个位置的同一蛋白质的多个匹配项。在这两种情况下,匹配都被唯一存储为UTE对象,位置被唯一存储为SPP对象。
HSP.*start == *start - 1
(由于Biopython中每个开始位置都是以0为基础)
HSP.aln_span == query-end - query-start
匹配的类型或地点(例如hmmer 3-match、hmmer 3-location、coils-match、panther-location)存储在hit. attractments中 ['Hit type'] .例如,对于每一场“恐惧匹配”,都会有一个“恐惧位置”。因此,Hit. ype将存储不包括“-match”或“-location”(在本示例中为“phobious”)的字符串。