Bio.SeqIO.TwoBitIO模块

Bio.SeqIO支持UCSC的“twoBit”(.2bit)文件格式。

该解析器读取存储在twoBit文件中的索引,以及每个序列的掩蔽区域和N。它还创建序列数据对象(_TwoBitSequenceData对象),该对象仅支持两种方法: __len__ 和 __getitem__. 前者将返回序列的长度,而后者返回所请求区域的序列(作为字节对象)。

使用索引中的信息, __getitem__ 方法计算请求的区域开始的文件位置,并且仅读取请求的序列区域。请注意,只有在特别请求时才会加载记录的完整序列,从而使解析器具有内存效率。

TwoBitIterator对象实现 __getitem__, 键和 __len__ 允许将其用作词典的方法。

class Bio.SeqIO.TwoBitIO.TwoBitIterator(source)

基类:SequenceIterator

UCSC twoBit(.2 bit)文件的解析器。

modes = 'b'
__init__(source)

读取文件索引。

__next__()

返回下一个条目。

__getitem__(name)

返回与给定名称关联的序列作为SeqRecord对象。

keys()

返回包含文件中序列名称的列表。

__len__()

返回序列数。

__abstractmethods__ = frozenset({})
__annotations__ = {}
__firstlineno__ = 170
__parameters__ = ()
__static_attributes__ = ('_names', 'byteorder', 'sequences')