Bio.GenBank.Record模块

以简单明了的格式保存GenBank数据。

班级:
  • 记录-GenBank记录中的所有信息。

  • 引用-保存记录的引用数据。

  • 要素(Feature)-在要素表中保存信息。

  • 限定符-要素上的限定符。

class Bio.GenBank.Record.Record

基类:object

以类似于原始记录的格式保存GenBank信息。

当您只对查看GenBank数据感兴趣时,Record类旨在使数据更容易访问。

属性:
  • locus-在GenBank记录中的locus关键字之后指定的名称。这可以是登录号,也可以是克隆ID或其他什么。

  • 大小-记录的大小。

  • RESIX_TYPE-组成此记录中序列的残基类型。通常像RNA、DNA或蛋白质一样,但也可能像“ss-RNA圆形”一样深奥。

  • DATA_FILE_DIVITION-此记录存储在GenBank中的分区(即PLN->植物;PRI->人类、灵长类动物;BCT->细菌.)

  • 日期-记录的深渊翻滚日期,格式类似于‘28-07-1998’

  • 登录号-序列的所有登录号的列表。

  • NID-核苷酸标识号。

  • PID-Proteint标识符号

  • 版本-注册号+版本(即AB01234.2)

  • DB_SOURCE-有关记录来自的数据库的信息

  • GI-记录的NCBI GI标识符。

  • 关键字-与记录相关的关键字列表。

  • 段-如果记录是一个系列中的一个,这是关于该记录是哪个段的信息(类似于‘1 of 6’)。

  • 来源-序列来源所在的材料来源。

  • 有机体-有机体的属和种(即(“智人”)

  • 分类法-生物体的分类学分类列表,开始是一般的,然后是更具体的。

  • 引用(References)-引用对象的列表。

  • 备注-包含有关记录的任何类型备注的文本。

  • 要素-构成要素表的要素列表。

  • BASE_COUNTS-包含序列的碱基计数的字符串。

  • Origin-指定有关序列原点的信息的字符串。

  • 序列-带有序列本身的字符串。

  • contig-RefSeq文件中CONTIG的位置信息字符串

  • 项目-基因组测序项目编号(将在2009年被dblink交叉引用取代)。

  • Dblinks-基因组测序项目编号和其他链接。(将在2009年替换项目信息)。

GB_LINE_LENGTH = 79
GB_BASE_INDENT = 12
GB_FEATURE_INDENT = 21
GB_INTERNAL_INDENT = 2
GB_OTHER_INTERNAL_INDENT = 3
GB_FEATURE_INTERNAL_INDENT = 5
GB_SEQUENCE_INDENT = 9
BASE_FORMAT = '%-12s'
INTERNAL_FORMAT = '  %-10s'
OTHER_INTERNAL_FORMAT = '   %-9s'
BASE_FEATURE_FORMAT = '%-21s'
INTERNAL_FEATURE_FORMAT = '     %-16s'
SEQUENCE_FORMAT = '%9s'
__init__()

初始化类。

__str__()

为记录提供GenBank格式的输出选项。

这样做的目的是提供一种简单的方法来读取GenBank记录,以某种方式对其进行修改,然后以“GenBank格式”输出。我们正在努力实现这一点,以便使用此函数输出的解析记录看起来与原始记录完全相同。

大部分输出基于位于以下位置的格式描述信息:

ftp://ncbi.nlm.nih.gov/genbank/gbrel.txt

class Bio.GenBank.Record.Reference

基类:object

保存来自GenBank引用的信息。

属性:
  • 编号(Number)-参照列表中的参照编号。

  • 碱基-参照所指序列中的碱基。

  • 作者-所有作者的字符串。

  • Conrtm-作者所属的联合体。

  • 标题-引用的标题。

  • 日记账-有关引用出现的日记账的信息。

  • Medline_id-引用的Medline ID。

  • pubMed_id-引用的pubmed_id。

  • 备注-有关参照的自由格式备注。

__init__()

初始化类。

__str__()

将引用转换为GenBank格式字符串。

class Bio.GenBank.Record.Feature(key='', location='')

基类:object

在GenBank记录的Feature Table中保存有关某个特征的信息。

属性:
  • 密钥-功能的密钥名称(即来源)

  • 位置-指定要素位置的字符串。

  • 限定符-要素中的限定符对象列表。

__init__(key='', location='')

初始化类。

__repr__()

用于调试或日志记录的对象的表示形式。

__str__()

以GenBank格式字符串形式返回要素。

class Bio.GenBank.Record.Qualifier(key='', value='')

基类:object

保存有关GenBank功能中的限定符的信息。

属性:
  • Key-限定符的密钥名称(即/有机体=)

  • 值-限定符(“盘基网柄菌”)的值。

__init__(key='', value='')

初始化类。

__repr__()

用于调试或日志记录的对象的表示形式。

__str__()

以GenBank格式字符串的形式返回功能限定符。