Bio.Align.maf模块

Bio.Align支持“maf”多重对齐格式。

UCSC描述的多重比对格式将一系列多重比对存储在单个文件中。它适合全基因组到全基因组的比对,可以存储源染色体、起始位置、大小和链等元数据。

请参阅http://genome.ucsc.edu/FAQ/FAQformat.html#format5

您需要通过Bio.Align功能使用此模块。

MAF格式中的坐标是根据从零开始的起始位置(如Python)和对齐区域大小定义的。

长度为一且从源序列中的第一个位置开始的最小对齐区域将具有 start == 0size == 1 .

正如我们在这个例子中看到的那样, start + size 将给出比零基结束位置多一个。因此我们可以操纵 startstart + size 作为Python列表切片边界。

class Bio.Align.maf.AlignmentWriter(target)

基类:AlignmentWriter

接受对齐对象,写入APM文件。

fmt: str | None = 'MAF'
write_header(stream, alignments)

写入APM标头。

format_alignment(alignment)

返回具有单一对齐格式为APM块的字符串。

__abstractmethods__ = frozenset({})
__annotations__ = {'fmt': 'Optional[str]'}
__firstlineno__ = 40
__static_attributes__ = ()
class Bio.Align.maf.AlignmentIterator(source)

基类:AlignmentIterator

多对齐格式文件的对齐迭代器。

该文件可能包含多个级联的对齐,这些对齐是增量加载和返回的。

文件元数据存储在 .metadata 返回的迭代器的属性。 对齐注释存储在 .annotations 属性 Alignment 对象,但对齐分数除外,该分数存储为属性。 对齐块中空部分的序列信息(将前一对齐块连接到下一对齐块,但不与当前对齐块对齐的序列)存储在 "empty" 钥匙路线中每条线特定的注释存储在 .annotations 相应序列记录的属性。

fmt: str | None = 'MAF'
status_characters = ('C', 'I', 'N', 'n', 'M', 'T')
empty_status_characters = ('C', 'I', 'M', 'n')
__abstractmethods__ = frozenset({})
__annotations__ = {'fmt': 'Optional[str]'}
__firstlineno__ = 255
__static_attributes__ = ('_aline', 'metadata')