Bio.Align.bigpsl模块

Bio.Align支持bigPsl格式的对齐文件。

bigPsl文件是BED 12 +13格式的bigBed文件,由autoSQL文件bigPsl.as中定义的12个预定义BED字段和13个自定义字段组成。该模块使用Bio.Align.bigbed模块来解析文件,但以bigPsl.as中定义的与PSL一致的方式存储数据。由于bigPsl格式是bigBed格式的特殊情况,因此bigPsl文件是二进制的,并被索引为bigBed文件。

请访问http://genome.ucsc.edu/goldenPath/help/bigPsl.html了解更多信息。

您需要通过Bio.Align功能使用此模块。

class Bio.Align.bigpsl.AlignmentWriter(target, targets=None, compress=True, extraIndex=(), cds=False, fa=False, mask=None, wildcard='N')

基类:AlignmentWriter

用于bigPsl文件格式的对齐文件编写器。

fmt: str | None = 'bigPsl'
__init__(target, targets=None, compress=True, extraIndex=(), cds=False, fa=False, mask=None, wildcard='N')

创建AlignmentWriter对象。

论点:
  • 目标 - 输出流或文件名。

  • 目标 - 染色体位于

    按它们在路线中出现的顺序排列。每个SeqRecord中的序列内容可能未定义,但必须定义序列长度,如本例所示:

    SeqRecord(Seq(无,长度=248956422),id=“chr1”)

    如果targets为“无”(默认值),则对齐必须具有一个属性.targets,以提供SeqRecord对象列表。

  • 压缩 - 如果为True(默认),请使用zlib压缩数据。

    如果为假,则不压缩数据。

  • extra Index-包含额外列名称的字符串列表

    索引。默认值是空列表。

  • CDs - 如果为True,请查找CDS类型的查询功能并写入

    它在PSL文件中采用NCBI风格(默认值:False)。

  • fa - 如果为True,请将查询序列包含在PSL文件中

    (默认值:False)。

  • 掩模 - 指定目标序列中的重复区域是否

    戴口罩,应在 repMatches 字段而不是在 matches 领域可接受值为无 :无掩码(默认);“lower”:按小写字符掩码;“upper”:按大写字符掩码。

  • 通配符 - 中报告与MIDI字符的对齐情况

    中的目标或查询序列 nCount 字段而不是在 matches , misMatches ,或者 repMatches 领域的默认值为“N”。

write_file(stream, alignments)

写文件。

__abstractmethods__ = frozenset({})
__annotations__ = {'fmt': 'Optional[str]'}
__firstlineno__ = 169
__static_attributes__ = ('cds', 'fa', 'mask', 'wildcard')
class Bio.Align.bigpsl.AlignmentIterator(source)

基类:AlignmentIterator

bigPsl文件的对齐迭代器。

存储在bigPsl文件中的成对比对被加载并以增量方式返回。 附加对齐信息存储为每个对齐的属性。

fmt: str | None = 'bigPsl'
__abstractmethods__ = frozenset({})
__annotations__ = {'fmt': 'Optional[str]'}
__firstlineno__ = 434
__static_attributes__ = ()