Bio.Align.bigmaf模块

Bio.Align对“bigmaf”多重对齐格式的支持。

bigMaf格式以与APM(多重对齐格式)格式兼容的格式存储多个对齐。BigMaf文件是二进制文件,并被索引为bigBed文件。

请参阅https://genome.ucsc.edu/goldenPath/help/bigMaf.html

class Bio.Align.bigmaf.AlignmentWriter(target, targets=None, compress=True, blockSize=256, itemsPerSlot=512)

基类:AlignmentWriter

用于bigMaf文件格式的对齐文件编写器。

fmt: str | None = 'bigMaf'
__init__(target, targets=None, compress=True, blockSize=256, itemsPerSlot=512)

创建AlignmentWriter对象。

论点:
  • 目标 - 输出流或文件名。

  • 目标 - 包含染色体的SeqRecord对象列表

    它们在排列中出现的顺序。每个SeqRecord中的序列内容可能未定义,但必须定义序列长度,如本例所示:

    SeqRecord(Seq(无,长度=248956422),id=“chr1”)

    如果targets为“无”(默认值),则对齐必须具有一个属性.targets,以提供SeqRecord对象列表。

  • 压缩 - 如果为True(默认),请使用zlib压缩数据。

    如果为假,则不压缩数据。使用compress=False以更快地搜索。

  • blockSize - 要在r树中捆绑的项目数。

    有关更多信息,请参阅UCSC的bedToBigBed计划。默认值为256。

  • itemsPerSlot -最低级别捆绑的数据点数量。

    有关更多信息,请参阅UCSC的bedToBigBed计划。使用itemsPerSlot=1可加快搜索速度。默认值为512。

write_file(stream, alignments)

写文件。

__abstractmethods__ = frozenset({})
__annotations__ = {'fmt': 'Optional[str]'}
__firstlineno__ = 60
__static_attributes__ = ()
class Bio.Align.bigmaf.AlignmentIterator(source)

基类:AlignmentIterator, AlignmentIterator

bigMaf文件的对齐迭代器。

该文件可能包含多个对齐,这些对齐是增量加载和返回的。

对齐注释存储在 .annotations 属性 Alignment 对象,但对齐分数除外,该分数存储为属性。 对齐块中空部分的序列信息(将前一对齐块连接到下一对齐块,但不与当前对齐块对齐的序列)存储在 "empty" 钥匙 路线中每条线特定的注释存储在 .annotations 相应序列记录的属性。

fmt: str | None = 'bigMaf'
mode = 'b'
__init__(source)

创建AlignmentIterator对象。

参数:- source -输入文件流,或输入文件的路径

__abstractmethods__ = frozenset({})
__annotations__ = {'fmt': 'Optional[str]'}
__firstlineno__ = 140
__static_attributes__ = ('_index', 'reference')