Bio.Align.sam模块
Bio.Align支持“sam”成对对齐格式。
序列比对/图谱(Sam)格式由Wellcome Trust Sanger Institute的Heng Li和Richard Durbin创建,将一系列基因组比对存储在单个文件中。通常,它们用于下一代测序数据。Sam文件存储映射序列的比对位置,并且还可以存储比对序列和与序列相关的其他信息。
请访问http://www.htslib.org/了解更多信息。
您需要通过Bio.Align功能使用此模块。
Sam格式中的坐标是根据以一为基础的开始位置定义的;解析器将这些坐标转换为以零为基础的坐标,以与Python和其他对齐格式一致。
- class Bio.Align.sam.AlignmentWriter(target, md=False)
-
序列比对/映射(Sam)文件格式的比对文件编写器。
- fmt: str | None = 'SAM'
- __init__(target, md=False)
创建AlignmentWriter对象。
- 论点:
- td-如果为True,则根据对齐计算MD标签并将其包含
在输出中。如果为False(默认),则不要在输出中包括MD标签。
- write_header(stream, alignments)
写入Sam标头。
- format_alignment(alignment, md=None)
返回具有单一对齐方式的字符串,格式为一个Sam行。
- __abstractmethods__ = frozenset({})
- __annotations__ = {'fmt': 'Optional[str]'}
- __firstlineno__ = 38
- __static_attributes__ = ('md',)
- class Bio.Align.sam.AlignmentIterator(source)
-
序列比对/映射(Sam)文件的比对迭代器。
文件中的每一行都包含一个基因组比对,这些比对将以增量方式加载和返回。 以下列存储为路线的属性:
flag:位标志的FLAG组合;
map:地图质量(仅在可用时存储)
- r下一步:下一次读取的主要比对的参考序列名称
在路线中(仅在可用时存储)
- pNext:下一次读取的主要对齐的从零开始的位置
模板(仅在可用时存储)
tlen:已签名的观察模板长度(仅在可用时存储)
通过其标签与路线关联的其他信息存储在每个路线的注释属性中。
任何硬剪辑(查询序列中不存在的剪辑序列)都存储为查询序列记录的注释字典属性中的“hard_clip_left”和“hard_clip_right”。
序列质量(如果可用)存储为“phred_quality”在查询序列记录的letter_annotations字典属性中。
- fmt: str | None = 'SAM'
- __abstractmethods__ = frozenset({})
- __annotations__ = {'fmt': 'Optional[str]'}
- __firstlineno__ = 372
- __static_attributes__ = ('_line', '_target_indices', 'metadata', 'targets')