Bio.Blast.NCBIXML模块¶
用于处理BLAST XML输出的代码。
BLAST XMLDTD文件位于NCBI FTP站点上:ftp://ftp.ncbi.nlm.nih.gov/blast/documents/xml/NCBI_BlastOutput.dtd
- class Bio.Blast.NCBIXML.BlastParser(debug=0)¶
基类:
_XMLparser
将XML BLAST数据解析为Record.Blast对象。
分析BLAST的XML输出(不建议直接使用)。这(现在)返回BLAST记录的列表。从历史上看,它返回了单一的爆炸记录。您需要通过parse或read函数使用它。
所有XML“action”方法都是私有方法,可以是:
_start_TAG
在找到开始标记时调用_end_TAG
在找到结束标记时调用
- __init__(debug=0)¶
初始化解析器。
- 参数:
DEBUG-INTEGER,要打印的调试信息量
- reset()¶
重置允许重用BlastParser()对象的所有数据。
- set_hit_id()¶
记录数据库序列的标识符(私有)。
- set_hit_def()¶
记录数据库序列的定义行(私有)。
- set_hit_accession()¶
记录数据库序列的访问值(私有)。
- set_hit_len()¶
记录下命中的长度。
- Bio.Blast.NCBIXML.read(handle, debug=0)¶
返回单个BLAST记录(假设只有一个查询)。
在内部使用BlastParser。
此函数用于在XML文件中只有一个爆炸结果时使用。
如果需要多个BLAST记录(即如果有多个查询序列),请使用Bio.Blast.NCBIXML.parse()函数。
- Bio.Blast.NCBIXML.parse(handle, debug=0)¶
为每个查询返回BLAST记录的迭代器。
增量解析器,这是一个返回BLAST记录的迭代器。它在内部使用BlastParser。
Handle-要分析的文件句柄和XML文件-整数,要打印的调试信息量
这是一个生成器函数,它返回多个BLAST记录对象-每个对象对应一个给定给BLAST的查询序列。文件以增量方式读取,在读入时返回完整的记录。
应该处理新的BLAST 2.2.14+,它为多个查询记录提供单个XML文件。
还应该处理旧版本BLAST的XML输出,BLAST提供了连接在一起的多个XML文件(给出了严格地说不是有效的XML的单个文件)。