Bio.SeqIO.TwoBitIO模块

Bio.SeqIO支持UCSC的“twoBit”(.2bit)文件格式。

该解析器读取存储在twoBit文件中的索引,以及每个序列的掩码区域和N。它还创建序列数据对象(_TwoBitSequenceData对象),这些对象仅支持两种方法: __len__ 和 __getitem__. 前者将返回序列的长度,而后者将返回所请求区域的序列(作为字节对象)。

使用索引中的信息, __getitem__ 方法计算请求区域开始的文件位置,并且只读取请求的序列区域。请注意,只有在明确请求的情况下才会加载记录的完整序列,这使得解析器的内存效率更高。

TwoBitIterator对象实现 __getitem__, 密钥,和 __len__ 允许将其用作字典的方法。

class Bio.SeqIO.TwoBitIO.TwoBitIterator(source)

基类:SequenceIterator

UCSC两位(.2bit)文件的解析器。

__init__(source)

读取文件索引。

parse(stream)

迭代文件中的序列。

__getitem__(name)
keys()

返回一个列表,其中包含文件中序列的名称。

__len__()
__abstractmethods__ = frozenset({})