Bio.Align.bigmaf模块
Bio.Align对“bigmaf”多重对齐格式的支持。
bigMaf格式以与APM(多重对齐格式)格式兼容的格式存储多个对齐。BigMaf文件是二进制文件,并被索引为bigBed文件。
请参阅https://genome.ucsc.edu/goldenPath/help/bigMaf.html
- class Bio.Align.bigmaf.AlignmentWriter(target, targets=None, compress=True, blockSize=256, itemsPerSlot=512)
-
用于bigMaf文件格式的对齐文件编写器。
- fmt: str | None = 'bigMaf'
- __init__(target, targets=None, compress=True, blockSize=256, itemsPerSlot=512)
创建AlignmentWriter对象。
- 论点:
目标 - 输出流或文件名。
- 目标 - 包含染色体的SeqRecord对象列表
它们在排列中出现的顺序。每个SeqRecord中的序列内容可能未定义,但必须定义序列长度,如本例所示:
SeqRecord(Seq(无,长度=248956422),id=“chr1”)
如果targets为“无”(默认值),则对齐必须具有一个属性.targets,以提供SeqRecord对象列表。
- 压缩 - 如果为True(默认),请使用zlib压缩数据。
如果为假,则不压缩数据。使用compress=False以更快地搜索。
- blockSize - 要在r树中捆绑的项目数。
有关更多信息,请参阅UCSC的bedToBigBed计划。默认值为256。
- itemsPerSlot -最低级别捆绑的数据点数量。
有关更多信息,请参阅UCSC的bedToBigBed计划。使用itemsPerSlot=1可加快搜索速度。默认值为512。
- write_file(stream, alignments)
写文件。
- __abstractmethods__ = frozenset({})
- __annotations__ = {'fmt': 'Optional[str]'}
- __firstlineno__ = 60
- __static_attributes__ = ()
- class Bio.Align.bigmaf.AlignmentIterator(source)
基类:
AlignmentIterator
,AlignmentIterator
bigMaf文件的对齐迭代器。
该文件可能包含多个对齐,这些对齐是增量加载和返回的。
对齐注释存储在
.annotations
属性Alignment
对象,但对齐分数除外,该分数存储为属性。 对齐块中空部分的序列信息(将前一对齐块连接到下一对齐块,但不与当前对齐块对齐的序列)存储在"empty"
钥匙 路线中每条线特定的注释存储在.annotations
相应序列记录的属性。- fmt: str | None = 'bigMaf'
- mode = 'b'
- __init__(source)
创建AlignmentIterator对象。
参数:- source -输入文件流,或输入文件的路径
- __abstractmethods__ = frozenset({})
- __annotations__ = {'fmt': 'Optional[str]'}
- __firstlineno__ = 140
- __static_attributes__ = ('_index', 'reference')