Bio.Align.psl模块
Bio.Align支持“psl”成对对齐格式。
UCSC描述的图案空间布局(PSL)格式将一系列成对对齐存储在单个文件中。通常,它们用于转录本与基因组的比对。PSL文件存储比对位置和比对分数,但不存储比对序列。
请参阅http://genome.ucsc.edu/FAQ/FAQformat.html#format2
您需要通过Bio.Align功能使用此模块。
PSL格式中的坐标是根据从零开始的位置(如Python)和对齐区域大小来定义的。
长度为一且从源序列中的第一个位置开始的最小对齐区域将具有 start == 0
和 size == 1
.
正如我们在这个例子中看到的那样, start + size
将给出比零基结束位置多一个。因此我们可以操纵 start
和 start + size
作为Python列表切片边界。
- class Bio.Align.psl.AlignmentWriter(target, header=True, mask=None, wildcard='N')
-
阵列空间布局(PSL)文件格式的路线文件编写器。
- fmt: str | None = 'PSL'
- __init__(target, header=True, mask=None, wildcard='N')
创建AlignmentWriter对象。
- 论点:
目标 - 输出流或文件名
- 报头 - 如果为True(默认),则写入由以下内容组成的PSL标头
五行包含PSL格式版本和每列的标题。如果为False,则隐藏PSL标头,从而生成简单的制表符分隔文件。
- 掩模 - 指定目标序列中的重复区域是否
戴口罩,应在 repMatches PSL文件的字段,而不是 matches 领域可接受值为无 :无掩码(默认);“lower”:按小写字符掩码;“upper”:按大写字符掩码。
- wildcard - Report alignments to the wildcard character in the
中的目标或查询序列 nCount PSL文件的字段,而不是 matches , misMatches ,或者 repMatches 领域的默认值为“N”。
- write_header(stream, alignments)
写入PSL标头。
- format_alignment(alignment)
返回具有单一对齐格式为一个PSL行的字符串。
- __abstractmethods__ = frozenset({})
- __annotations__ = {'fmt': 'Optional[str]'}
- __firstlineno__ = 45
- __static_attributes__ = ('header', 'mask', 'wildcard')
- class Bio.Align.psl.AlignmentIterator(source)
-
图案空间布局(PSL)文件的对齐迭代器。
文件中的每一行都包含一个成对对齐,这些对齐是增量加载和返回的。 匹配和不匹配的数量等比对分数信息被存储为每个比对的属性。
- fmt: str | None = 'PSL'
- __abstractmethods__ = frozenset({})
- __annotations__ = {'fmt': 'Optional[str]'}
- __firstlineno__ = 310
- __static_attributes__ = ('_line', 'metadata')