Bio.AlignIO.MafIO模块

Bio.AlignIO支持“maf”多重对齐格式。

UCSC描述的多重比对格式将一系列多重比对存储在单个文件中。它适合全基因组到全基因组的比对,可以存储源染色体、起始位置、大小和链等元数据。

请参阅http://genome.ucsc.edu/FAQ/FAQformat.html#format5

预计您将通过Bio.AlignIO函数(或者,如果您想直接处理间隔序列,则通过Bio.SeqIO函数)使用此模块。

MAF格式中的坐标是根据从零开始的起始位置(如Python)和对齐区域大小定义的。

长度为一且从源序列中的第一个位置开始的最小对齐区域将具有 start == 0size == 1 .

正如我们在这个例子中看到的那样, start + size 将给出比零基结束位置多一个。因此我们可以操纵 startstart + size 作为Python列表切片边界。

对于包容的末端坐标,我们需要使用 end = start + size - 1 . 1柱宽对齐将具有 start == end .

class Bio.AlignIO.MafIO.MafWriter(handle)

基类:SequentialAlignmentWriter

接受MultipleSeqAlliance对象,写入一个APM文件。

write_header()

写入APM标头。

write_alignment(alignment)

将完整对齐写入到APM块。

将MultipleSeqTerm对象中的每个SeqRecord写入其自己的APM块(以“a”行开始,包含“s”行)。

__annotations__ = {}
__firstlineno__ = 53
__static_attributes__ = ()
Bio.AlignIO.MafIO.MafIterator(handle, seq_count=None)

作为MultipleSeqEquality对象迭代UF文件手柄。

迭代类似于APM文件的对象(柄)中的行,产生MultipleSeqEqualition对象。SeqRecord ID通常对应于物种名称。

class Bio.AlignIO.MafIO.MafIndex(sqlite_file, maf_file, target_seqname)

基类:object

APM文件的索引。

该索引是一个平方米数据库,如果需要,它在创建对象时构建,并在方法时进行查询 searchget_spliced 被使用。

__init__(sqlite_file, maf_file, target_seqname)

索引或加载APM文件的索引。

close()

关闭用于读取数据的文件手柄。

一旦调用,进一步使用该索引就行不通了。此方法的唯一目的是允许显式的手柄关闭-例如,如果您希望删除该文件,则在Windows上,您必须首先关闭该文件的所有打开的手柄。

search(starts, ends)

搜索索引数据库以寻找所提供的重叠范围的APM记录。

返回 MultipleSeqAlignment 结果按开始、结束、内部补偿字段的顺序进行。

starts 应该是引用中分段从0开始的开始坐标列表。 ends 应该是相应段结束的列表(在半开放的UCSC会议中:http://genome.ucsc.edu/blog/the-ucsc-genome-browser-coordinate-counting-system/)。

get_spliced(starts, ends, strand=1)

返回所提供的确切序列范围的多重比对。

接受Target_seqName上的两个开始和结束位置列表,代表要通过计算机拼接的exons。 返回一个 MultipleSeqAlignment 拼接在一起的序列。

starts 应该是引用中分段从0开始的开始坐标列表。 ends 应该是相应段结束的列表(在半开放的UCSC会议中:http://genome.ucsc.edu/blog/the-ucsc-genome-browser-coordinate-counting-system/)。

要请求与参考序列的前100个核苷酸对应的比对部分,可以使用 search([0], [100])

__firstlineno__ = 259
__repr__()

返回索引的字符串表示形式。

__static_attributes__ = ('_con', '_index_filename', '_maf_file', '_maf_fp', '_mafiter', '_record_count', '_relative_path', '_target_seqname')
__len__()

返回索引中的记录数。