Bio.GenBank软件包

子模块

模块内容

用于处理GenBank格式文件的代码。

现在,建议您使用“GenBank”或“embl”格式名称的Bio.SeqIO来将GenBank或EMBL文件解析为SeqRecord和SeqFeature对象,而不是使用Bio.GenBank(有关详细信息,请参见Biopython教程)。

仅当您要获取特定于GenBank的记录对象时,使用Bio.GenBank直接解析GenBank文件才有用,与FeatureParser中的SeqRecord替代方法(在Bio.SeqIO中使用)相比,该记录对象更接近原始文件内容。

要使用Bio.GenBank解析器,有两个助手函数:

  • Read Parse将包含单个GenBank记录的句柄解析为Bio.GenBank特定的记录对象。

  • 将包含多个GenBank记录的句柄作为Bio.GenBank特定的记录对象进行解析迭代。

以下内部类不打算直接使用,可能会在将来的版本中弃用。

班级:
  • 迭代器遍历GenBank条目文件

  • ErrorFeatureParser捕获分析过程中导致的错误。

  • FeatureParser解析SeqRecord和SeqFeature对象中的GenBank数据。

  • RecordParser将GenBank数据解析为记录对象。

例外情况:
  • 指示解析器失败的ParserFailureError异常(即扫描仪或消费者)

  • LocationParserError异常,指示基于电光的位置解析器有问题。

class Bio.GenBank.Iterator(handle, parser=None)

基类:object

迭代器界面,用于一次移动一个GenBank条目文件(已过时)。

此类很可能在未来的Biopython版本中被弃用。请使用Bio.SeqIO.parse(.,format=“GB”)或Bio.GenBank.parse(.)而是分别用于SeqRecord和GenBank特定的记录对象。

__init__(handle, parser=None)

初始化迭代器。

参数:
  • 句柄-要遍历的GenBank条目的句柄。

  • 解析器-可选的解析器,用于在返回条目之前传递它们。如果没有,则返回原始条目。

__next__()

从句柄返回下一条GenBank记录。

如果记录用完,将返回NONE。

__iter__()

重复记录。

exception Bio.GenBank.ParserFailureError

基类:Exception

由解析器中的某种问题导致的故障。

exception Bio.GenBank.LocationParserError

基类:Exception

无法从GenBank文件中正确解析出位置。

class Bio.GenBank.FeatureParser(debug_level=0, use_fuzziness=1, feature_cleaner=None)

基类:object

将GenBank文件解析为Seq+特征对象(废弃)。

不鼓励直接使用此类,在未来的Biopython版本中可能会弃用此类。

请使用Bio.SeqIO.parse(.)或Bio.SeqIO.read(.)取而代之的是。

__init__(debug_level=0, use_fuzziness=1, feature_cleaner=None)

初始化GenBank解析器和功能消费者。

参数:
  • DEBUG_LEVEL-一个可选参数,指定解析器应该输出的调试信息量。默认情况下,我们没有调试信息(做事情的最快方式),但如果您愿意,可以将其设置为最高2,并查看解析失败的确切位置。

  • USE_FUZZINITY-指定是否使用模糊表示。默认值为1(使用模糊性)。

  • FEATURE_CLEARER-将用于清除要素值的类。该类必须实现函数CLEAN_VALUE。utils有一个默认使用的“标准”清理程序类。

parse(handle)

解析指定的句柄。

class Bio.GenBank.RecordParser(debug_level=0)

基类:object

将GenBank文件解析为记录对象(已过时)。

不鼓励直接使用此类,在未来的Biopython版本中可能会弃用此类。

请使用Bio.GenBank.parse(.)或Bio.GenBank.read(.)取而代之的是功能。

__init__(debug_level=0)

初始化解析器。

参数:
  • DEBUG_LEVEL-一个可选参数,指定解析器应该输出的调试信息量。默认情况下,我们没有调试信息(做事情的最快方式),但如果您愿意,可以将其设置为最高2,并查看解析失败的确切位置。

parse(handle)

将指定的句柄解析为GenBank记录。

Bio.GenBank.parse(handle)

将GenBank格式的条目作为记录对象进行迭代。

>>> from Bio import GenBank
>>> with open("GenBank/NC_000932.gb") as handle:
...     for record in GenBank.parse(handle):
...         print(record.accession)
['NC_000932']

要获取SeqRecord对象,请改用Bio.SeqIO.parse(.,format=“GB”)。

Bio.GenBank.read(handle)

读取包含单个GenBank条目的句柄作为记录对象。

>>> from Bio import GenBank
>>> with open("GenBank/NC_000932.gb") as handle:
...     record = GenBank.read(handle)
...     print(record.accession)
['NC_000932']

要获取SeqRecord对象,请改用Bio.SeqIO.read(.,format=“GB”)。