Bio.Blast.NCBIXML模块

用于处理BLAST XML输出的代码。

BLAST XMLDTD文件位于NCBI FTP站点上:ftp://ftp.ncbi.nlm.nih.gov/blast/documents/xml/NCBI_BlastOutput.dtd

class Bio.Blast.NCBIXML.BlastParser(debug=0)

基类:_XMLparser

将XML BLAST数据解析为Record.Blast对象。

分析BLAST的XML输出(不建议直接使用)。这(现在)返回BLAST记录的列表。从历史上看,它返回了单一的爆炸记录。您需要通过parse或read函数使用它。

所有XML“action”方法都是私有方法,可以是:

  • _start_TAG 在找到开始标记时调用

  • _end_TAG 在找到结束标记时调用

__init__(debug=0)

初始化解析器。

参数:
  • DEBUG-INTEGER,要打印的调试信息量

reset()

重置允许重用BlastParser()对象的所有数据。

set_hit_id()

记录数据库序列的标识符(私有)。

set_hit_def()

记录数据库序列的定义行(私有)。

set_hit_accession()

记录数据库序列的访问值(私有)。

set_hit_len()

记录下命中的长度。

Bio.Blast.NCBIXML.read(handle, debug=0)

返回单个BLAST记录(假设只有一个查询)。

在内部使用BlastParser。

此函数用于在XML文件中只有一个爆炸结果时使用。

如果需要多个BLAST记录(即如果有多个查询序列),请使用Bio.Blast.NCBIXML.parse()函数。

Bio.Blast.NCBIXML.parse(handle, debug=0)

为每个查询返回BLAST记录的迭代器。

增量解析器,这是一个返回BLAST记录的迭代器。它在内部使用BlastParser。

Handle-要分析的文件句柄和XML文件-整数,要打印的调试信息量

这是一个生成器函数,它返回多个BLAST记录对象-每个对象对应一个给定给BLAST的查询序列。文件以增量方式读取,在读入时返回完整的记录。

应该处理新的BLAST 2.2.14+,它为多个查询记录提供单个XML文件。

还应该处理旧版本BLAST的XML输出,BLAST提供了连接在一起的多个XML文件(给出了严格地说不是有效的XML的单个文件)。