Bio.Align.bigpsl模块
Bio.Align支持bigPsl格式的对齐文件。
bigPsl文件是BED 12 +13格式的bigBed文件,由autoSQL文件bigPsl.as中定义的12个预定义BED字段和13个自定义字段组成。该模块使用Bio.Align.bigbed模块来解析文件,但以bigPsl.as中定义的与PSL一致的方式存储数据。由于bigPsl格式是bigBed格式的特殊情况,因此bigPsl文件是二进制的,并被索引为bigBed文件。
请访问http://genome.ucsc.edu/goldenPath/help/bigPsl.html了解更多信息。
您需要通过Bio.Align功能使用此模块。
- class Bio.Align.bigpsl.AlignmentWriter(target, targets=None, compress=True, extraIndex=(), cds=False, fa=False, mask=None, wildcard='N')
-
用于bigPsl文件格式的对齐文件编写器。
- fmt: str | None = 'bigPsl'
- __init__(target, targets=None, compress=True, extraIndex=(), cds=False, fa=False, mask=None, wildcard='N')
创建AlignmentWriter对象。
- 论点:
目标 - 输出流或文件名。
- 目标 - 染色体位于
按它们在路线中出现的顺序排列。每个SeqRecord中的序列内容可能未定义,但必须定义序列长度,如本例所示:
SeqRecord(Seq(无,长度=248956422),id=“chr1”)
如果targets为“无”(默认值),则对齐必须具有一个属性.targets,以提供SeqRecord对象列表。
- 压缩 - 如果为True(默认),请使用zlib压缩数据。
如果为假,则不压缩数据。
- extra Index-包含额外列名称的字符串列表
索引。默认值是空列表。
- CDs - 如果为True,请查找CDS类型的查询功能并写入
它在PSL文件中采用NCBI风格(默认值:False)。
- fa - 如果为True,请将查询序列包含在PSL文件中
(默认值:False)。
- 掩模 - 指定目标序列中的重复区域是否
戴口罩,应在 repMatches 字段而不是在 matches 领域可接受值为无 :无掩码(默认);“lower”:按小写字符掩码;“upper”:按大写字符掩码。
- 通配符 - 中报告与MIDI字符的对齐情况
中的目标或查询序列 nCount 字段而不是在 matches , misMatches ,或者 repMatches 领域的默认值为“N”。
- write_file(stream, alignments)
写文件。
- __abstractmethods__ = frozenset({})
- __annotations__ = {'fmt': 'Optional[str]'}
- __firstlineno__ = 169
- __static_attributes__ = ('cds', 'fa', 'mask', 'wildcard')