Bio.Align.psl模块

Bio.Align支持“psl”成对对齐格式。

UCSC描述的图案空间布局(PSL)格式将一系列成对对齐存储在单个文件中。通常,它们用于转录本与基因组的比对。PSL文件存储比对位置和比对分数,但不存储比对序列。

请参阅http://genome.ucsc.edu/FAQ/FAQformat.html#format2

您需要通过Bio.Align功能使用此模块。

PSL格式中的坐标是根据从零开始的位置(如Python)和对齐区域大小来定义的。

长度为一且从源序列中的第一个位置开始的最小对齐区域将具有 start == 0size == 1 .

正如我们在这个例子中看到的那样, start + size 将给出比零基结束位置多一个。因此我们可以操纵 startstart + size 作为Python列表切片边界。

class Bio.Align.psl.AlignmentWriter(target, header=True, mask=None, wildcard='N')

基类:AlignmentWriter

阵列空间布局(PSL)文件格式的路线文件编写器。

fmt: str | None = 'PSL'
__init__(target, header=True, mask=None, wildcard='N')

创建AlignmentWriter对象。

论点:
  • 目标 - 输出流或文件名

  • 报头 - 如果为True(默认),则写入由以下内容组成的PSL标头

    五行包含PSL格式版本和每列的标题。如果为False,则隐藏PSL标头,从而生成简单的制表符分隔文件。

  • 掩模 - 指定目标序列中的重复区域是否

    戴口罩,应在 repMatches PSL文件的字段,而不是 matches 领域可接受值为无 :无掩码(默认);“lower”:按小写字符掩码;“upper”:按大写字符掩码。

  • wildcard - Report alignments to the wildcard character in the

    中的目标或查询序列 nCount PSL文件的字段,而不是 matches , misMatches ,或者 repMatches 领域的默认值为“N”。

write_header(stream, alignments)

写入PSL标头。

format_alignment(alignment)

返回具有单一对齐格式为一个PSL行的字符串。

__abstractmethods__ = frozenset({})
__annotations__ = {'fmt': 'Optional[str]'}
__firstlineno__ = 45
__static_attributes__ = ('header', 'mask', 'wildcard')
class Bio.Align.psl.AlignmentIterator(source)

基类:AlignmentIterator

图案空间布局(PSL)文件的对齐迭代器。

文件中的每一行都包含一个成对对齐,这些对齐是增量加载和返回的。 匹配和不匹配的数量等比对分数信息被存储为每个比对的属性。

fmt: str | None = 'PSL'
__abstractmethods__ = frozenset({})
__annotations__ = {'fmt': 'Optional[str]'}
__firstlineno__ = 310
__static_attributes__ = ('_line', 'metadata')