Bio.GenBank.Record模块¶
以简单明了的格式保存GenBank数据。
- 班级:
记录-GenBank记录中的所有信息。
引用-保存记录的引用数据。
要素(Feature)-在要素表中保存信息。
限定符-要素上的限定符。
- class Bio.GenBank.Record.Record¶
基类:
object
以类似于原始记录的格式保存GenBank信息。
当您只对查看GenBank数据感兴趣时,Record类旨在使数据更容易访问。
- 属性:
locus-在GenBank记录中的locus关键字之后指定的名称。这可以是登录号,也可以是克隆ID或其他什么。
大小-记录的大小。
RESIX_TYPE-组成此记录中序列的残基类型。通常像RNA、DNA或蛋白质一样,但也可能像“ss-RNA圆形”一样深奥。
DATA_FILE_DIVITION-此记录存储在GenBank中的分区(即PLN->植物;PRI->人类、灵长类动物;BCT->细菌.)
日期-记录的深渊翻滚日期,格式类似于‘28-07-1998’
登录号-序列的所有登录号的列表。
NID-核苷酸标识号。
PID-Proteint标识符号
版本-注册号+版本(即AB01234.2)
DB_SOURCE-有关记录来自的数据库的信息
GI-记录的NCBI GI标识符。
关键字-与记录相关的关键字列表。
段-如果记录是一个系列中的一个,这是关于该记录是哪个段的信息(类似于‘1 of 6’)。
来源-序列来源所在的材料来源。
有机体-有机体的属和种(即(“智人”)
分类法-生物体的分类学分类列表,开始是一般的,然后是更具体的。
引用(References)-引用对象的列表。
备注-包含有关记录的任何类型备注的文本。
要素-构成要素表的要素列表。
BASE_COUNTS-包含序列的碱基计数的字符串。
Origin-指定有关序列原点的信息的字符串。
序列-带有序列本身的字符串。
contig-RefSeq文件中CONTIG的位置信息字符串
项目-基因组测序项目编号(将在2009年被dblink交叉引用取代)。
Dblinks-基因组测序项目编号和其他链接。(将在2009年替换项目信息)。
- GB_LINE_LENGTH = 79¶
- GB_BASE_INDENT = 12¶
- GB_FEATURE_INDENT = 21¶
- GB_INTERNAL_INDENT = 2¶
- GB_OTHER_INTERNAL_INDENT = 3¶
- GB_FEATURE_INTERNAL_INDENT = 5¶
- GB_SEQUENCE_INDENT = 9¶
- BASE_FORMAT = '%-12s'¶
- INTERNAL_FORMAT = ' %-10s'¶
- OTHER_INTERNAL_FORMAT = ' %-9s'¶
- BASE_FEATURE_FORMAT = '%-21s'¶
- INTERNAL_FEATURE_FORMAT = ' %-16s'¶
- SEQUENCE_FORMAT = '%9s'¶
- __init__()¶
初始化类。
- __str__()¶
为记录提供GenBank格式的输出选项。
这样做的目的是提供一种简单的方法来读取GenBank记录,以某种方式对其进行修改,然后以“GenBank格式”输出。我们正在努力实现这一点,以便使用此函数输出的解析记录看起来与原始记录完全相同。
大部分输出基于位于以下位置的格式描述信息:
- class Bio.GenBank.Record.Reference¶
基类:
object
保存来自GenBank引用的信息。
- 属性:
编号(Number)-参照列表中的参照编号。
碱基-参照所指序列中的碱基。
作者-所有作者的字符串。
Conrtm-作者所属的联合体。
标题-引用的标题。
日记账-有关引用出现的日记账的信息。
Medline_id-引用的Medline ID。
pubMed_id-引用的pubmed_id。
备注-有关参照的自由格式备注。
- __init__()¶
初始化类。
- __str__()¶
将引用转换为GenBank格式字符串。