Bio.Align.bigpsl模块

Bio.Align支持bigPsl格式的对齐文件。

bigPsl文件是BED 12 +13格式的bigBed文件，由autoSQL文件bigPsl.as中定义的12个预定义BED字段和13个自定义字段组成。该模块使用Bio.Align.bigbed模块来解析文件，但以bigPsl.as中定义的与PSL一致的方式存储数据。由于bigPsl格式是bigBed格式的特殊情况，因此bigPsl文件是二进制的，并被索引为bigBed文件。

请访问http://genome.ucsc.edu/goldenPath/help/bigPsl.html了解更多信息。

您需要通过Bio.Align功能使用此模块。

class Bio.Align.bigpsl.AlignmentWriter(target, targets=None, compress=True, extraIndex=(), cds=False, fa=False, mask=None, wildcard='N')

基类：AlignmentWriter

用于bigPsl文件格式的对齐文件编写器。

fmt: str | None = 'bigPsl'

__init__(target, targets=None, compress=True, extraIndex=(), cds=False, fa=False, mask=None, wildcard='N')

创建AlignmentWriter对象。

论点：

目标 - 输出流或文件名。
目标 - 染色体位于
按它们在路线中出现的顺序排列。每个SeqRecord中的序列内容可能未定义，但必须定义序列长度，如本例所示：

SeqRecord（Seq（无，长度=248956422），id=“chr1”）

如果targets为“无”（默认值），则对齐必须具有一个属性.targets，以提供SeqRecord对象列表。
压缩 - 如果为True（默认），请使用zlib压缩数据。
如果为假，则不压缩数据。
extra Index-包含额外列名称的字符串列表
索引。默认值是空列表。
CDs - 如果为True，请查找CDS类型的查询功能并写入
它在PSL文件中采用NCBI风格（默认值：False）。
fa - 如果为True，请将查询序列包含在PSL文件中
（默认值：False）。
掩模 - 指定目标序列中的重复区域是否
戴口罩，应在 repMatches 字段而不是在 matches 领域可接受值为无：无掩码（默认）;“lower”：按小写字符掩码;“upper”：按大写字符掩码。
通配符 - 中报告与MIDI字符的对齐情况
中的目标或查询序列 nCount 字段而不是在 matches , misMatches ，或者 repMatches 领域的默认值为“N”。

write_file(stream, alignments): 写文件。

__abstractmethods__ = frozenset({})

__annotations__ = {'fmt': 'Optional[str]'}

__firstlineno__ = 169

__static_attributes__ = ('cds', 'fa', 'mask', 'wildcard')

class Bio.Align.bigpsl.AlignmentIterator(source)

基类：AlignmentIterator

bigPsl文件的对齐迭代器。

存储在bigPsl文件中的成对比对被加载并以增量方式返回。附加对齐信息存储为每个对齐的属性。

fmt: str | None = 'bigPsl'

__abstractmethods__ = frozenset({})

__annotations__ = {'fmt': 'Optional[str]'}

__firstlineno__ = 434

__static_attributes__ = ()