Bio.AlignIO.FastaIO模块
Bio.AlignIO支持Bill Pearson的FASTA工具的“fasta-m10”输出。
预计您将通过Bio.AlignIO函数(或者,如果您想直接处理间隔序列,则通过Bio.SeqIO函数)使用此模块。
该模块包含一个用于由Bill Pearson的FASTA工具生成的成对比对的解析器,用于从Bio.AlignIO接口使用,其中它被称为“fasta-m10”文件格式(因为我们只支持使用-m10命令行选项选择的机器可读输出格式)。
此模块不涵盖最初作为FASTA工具输入格式开发的通用“fasta”文件格式。 Bio.AlignIO和Bio.SeqIO都使用Bio.SeqIO.FastaIO模块来处理这些文件,该文件也可用于存储多个序列比对。
- Bio.AlignIO.FastaIO.FastaM10Iterator(handle, seq_count=None)
FASTA工具的成对比对输出的比对迭代器。
当使用-m 10命令行选项调用Bill Pearson的FASTA程序以获得机器可读输出时,这用于读取Bill Pearson的FASTA程序输出的成对比对。 有关FASTA工具的更多详细信息,请参阅网站http://fasta.bioch.virginia.edu/和论文:
W.R. Pearson & DJ Lipman PNAS(1988)85:2444-2448
此类旨在通过Bio.AlignIO.parse()函数使用,方法是将格式指定为“fasta-m10”,如以下代码所示:
from Bio import AlignIO handle = ... for a in AlignIO.parse(handle, "fasta-m10"): assert len(a) == 2, "Should be pairwise!" print("Alignment length %i" % a.get_alignment_length()) for record in a: print("%s %s %s" % (record.seq, record.name, record.id))
请注意,这并不是FASTA输出中所有信息的完整解析器-例如,大部分标头和所有脚注都被忽略。 此外,对齐不会根据输入查询进行批处理。
另请注意,原始FASTA输出中可能包含多达约30个侧翼区域字母作为上下文信息。 这不是对齐本身的一部分,并且不包括在返回的结果MultipleSeqEqualition对象中。