Bio.AlignIO.FastaIO模块

Bio.AlignIO支持Bill Pearson的FASTA工具的“fasta-m10”输出。

预计您将通过Bio.AlignIO函数(或者,如果您想直接处理间隔序列,则通过Bio.SeqIO函数)使用此模块。

该模块包含一个用于由Bill Pearson的FASTA工具生成的成对比对的解析器,用于从Bio.AlignIO接口使用,其中它被称为“fasta-m10”文件格式(因为我们只支持使用-m10命令行选项选择的机器可读输出格式)。

此模块不涵盖最初作为FASTA工具输入格式开发的通用“fasta”文件格式。 Bio.AlignIO和Bio.SeqIO都使用Bio.SeqIO.FastaIO模块来处理这些文件,该文件也可用于存储多个序列比对。

Bio.AlignIO.FastaIO.FastaM10Iterator(handle, seq_count=None)

FASTA工具的成对比对输出的比对迭代器。

当使用-m 10命令行选项调用Bill Pearson的FASTA程序以获得机器可读输出时,这用于读取Bill Pearson的FASTA程序输出的成对比对。 有关FASTA工具的更多详细信息,请参阅网站http://fasta.bioch.virginia.edu/和论文:

W.R. Pearson & DJ Lipman PNAS(1988)85:2444-2448

此类旨在通过Bio.AlignIO.parse()函数使用,方法是将格式指定为“fasta-m10”,如以下代码所示:

from Bio import AlignIO
handle = ...
for a in AlignIO.parse(handle, "fasta-m10"):
    assert len(a) == 2, "Should be pairwise!"
    print("Alignment length %i" % a.get_alignment_length())
    for record in a:
        print("%s %s %s" % (record.seq, record.name, record.id))

请注意,这并不是FASTA输出中所有信息的完整解析器-例如,大部分标头和所有脚注都被忽略。 此外,对齐不会根据输入查询进行批处理。

另请注意,原始FASTA输出中可能包含多达约30个侧翼区域字母作为上下文信息。 这不是对齐本身的一部分,并且不包括在返回的结果MultipleSeqEqualition对象中。