Bio.Align.maf模块
Bio.Align支持“maf”多重对齐格式。
UCSC描述的多重比对格式将一系列多重比对存储在单个文件中。它适合全基因组到全基因组的比对,可以存储源染色体、起始位置、大小和链等元数据。
请参阅http://genome.ucsc.edu/FAQ/FAQformat.html#format5
您需要通过Bio.Align功能使用此模块。
MAF格式中的坐标是根据从零开始的起始位置(如Python)和对齐区域大小定义的。
长度为一且从源序列中的第一个位置开始的最小对齐区域将具有 start == 0
和 size == 1
.
正如我们在这个例子中看到的那样, start + size
将给出比零基结束位置多一个。因此我们可以操纵 start
和 start + size
作为Python列表切片边界。
- class Bio.Align.maf.AlignmentWriter(target)
-
接受对齐对象,写入APM文件。
- fmt: str | None = 'MAF'
- write_header(stream, alignments)
写入APM标头。
- format_alignment(alignment)
返回具有单一对齐格式为APM块的字符串。
- __abstractmethods__ = frozenset({})
- __annotations__ = {'fmt': 'Optional[str]'}
- __firstlineno__ = 40
- __static_attributes__ = ()
- class Bio.Align.maf.AlignmentIterator(source)
-
多对齐格式文件的对齐迭代器。
该文件可能包含多个级联的对齐,这些对齐是增量加载和返回的。
文件元数据存储在
.metadata
返回的迭代器的属性。 对齐注释存储在.annotations
属性Alignment
对象,但对齐分数除外,该分数存储为属性。 对齐块中空部分的序列信息(将前一对齐块连接到下一对齐块,但不与当前对齐块对齐的序列)存储在"empty"
钥匙路线中每条线特定的注释存储在.annotations
相应序列记录的属性。- fmt: str | None = 'MAF'
- status_characters = ('C', 'I', 'N', 'n', 'M', 'T')
- empty_status_characters = ('C', 'I', 'M', 'n')
- __abstractmethods__ = frozenset({})
- __annotations__ = {'fmt': 'Optional[str]'}
- __firstlineno__ = 255
- __static_attributes__ = ('_aline', 'metadata')