Bio.SeqIO.TwoBitIO模块
Bio.SeqIO支持UCSC的“twoBit”(.2bit)文件格式。
该解析器读取存储在twoBit文件中的索引,以及每个序列的掩蔽区域和N。它还创建序列数据对象(_TwoBitSequenceData对象),该对象仅支持两种方法: __len__ 和 __getitem__. 前者将返回序列的长度,而后者返回所请求区域的序列(作为字节对象)。
使用索引中的信息, __getitem__ 方法计算请求的区域开始的文件位置,并且仅读取请求的序列区域。请注意,只有在特别请求时才会加载记录的完整序列,从而使解析器具有内存效率。
TwoBitIterator对象实现 __getitem__, 键和 __len__ 允许将其用作词典的方法。
- class Bio.SeqIO.TwoBitIO.TwoBitIterator(source)
-
UCSC twoBit(.2 bit)文件的解析器。
- modes = 'b'
- __init__(source)
读取文件索引。
- __next__()
返回下一个条目。
- __getitem__(name)
返回与给定名称关联的序列作为SeqRecord对象。
- keys()
返回包含文件中序列名称的列表。
- __len__()
返回序列数。
- __abstractmethods__ = frozenset({})
- __annotations__ = {}
- __firstlineno__ = 170
- __parameters__ = ()
- __static_attributes__ = ('_names', 'byteorder', 'sequences')