Bio.Align.sam模块

Bio.Align支持“sam”成对对齐格式。

序列比对/图谱(Sam)格式由Wellcome Trust Sanger Institute的Heng Li和Richard Durbin创建,将一系列基因组比对存储在单个文件中。通常,它们用于下一代测序数据。Sam文件存储映射序列的比对位置,并且还可以存储比对序列和与序列相关的其他信息。

请访问http://www.htslib.org/了解更多信息。

您需要通过Bio.Align功能使用此模块。

Sam格式中的坐标是根据以一为基础的开始位置定义的;解析器将这些坐标转换为以零为基础的坐标,以与Python和其他对齐格式一致。

class Bio.Align.sam.AlignmentWriter(target, md=False)

基类:AlignmentWriter

序列比对/映射(Sam)文件格式的比对文件编写器。

fmt: str | None = 'SAM'
__init__(target, md=False)

创建AlignmentWriter对象。

论点:
  • td-如果为True,则根据对齐计算MD标签并将其包含

    在输出中。如果为False(默认),则不要在输出中包括MD标签。

write_header(stream, alignments)

写入Sam标头。

format_alignment(alignment, md=None)

返回具有单一对齐方式的字符串,格式为一个Sam行。

__abstractmethods__ = frozenset({})
__annotations__ = {'fmt': 'Optional[str]'}
__firstlineno__ = 38
__static_attributes__ = ('md',)
class Bio.Align.sam.AlignmentIterator(source)

基类:AlignmentIterator

序列比对/映射(Sam)文件的比对迭代器。

文件中的每一行都包含一个基因组比对,这些比对将以增量方式加载和返回。 以下列存储为路线的属性:

  • flag:位标志的FLAG组合;

  • map:地图质量(仅在可用时存储)

  • r下一步:下一次读取的主要比对的参考序列名称

    在路线中(仅在可用时存储)

  • pNext:下一次读取的主要对齐的从零开始的位置

    模板(仅在可用时存储)

  • tlen:已签名的观察模板长度(仅在可用时存储)

通过其标签与路线关联的其他信息存储在每个路线的注释属性中。

任何硬剪辑(查询序列中不存在的剪辑序列)都存储为查询序列记录的注释字典属性中的“hard_clip_left”和“hard_clip_right”。

序列质量(如果可用)存储为“phred_quality”在查询序列记录的letter_annotations字典属性中。

fmt: str | None = 'SAM'
__abstractmethods__ = frozenset({})
__annotations__ = {'fmt': 'Optional[str]'}
__firstlineno__ = 372
__static_attributes__ = ('_line', '_target_indices', 'metadata', 'targets')