生物。基因库。记录模块
以简单的格式保存SEN数据。
- 职业:
记录-基因库记录中的所有信息。
引用-保存记录的引用数据。
特征-将信息保存在特征表中。
简化器-功能上的简化器。
- class Bio.GenBank.Record.Record
基类:
object
以与原始记录类似的格式保存基因库信息。
Record类的目的是让您在仅对查看ESB数据感兴趣时轻松获取数据。
- 属性:
locus -在SEN记录中LOCUS关键字后面指定的名称。这可能是登录号、克隆ID或其他内容。
大小-记录的大小。
residue_style-构成此记录中序列的残基类型。通常类似于RNA、DNA或蛋白质,但可能像“ss-RNA环”一样深奥。
data_file_division -此记录在基因库中存储的部门(即印尼国家电力局->植物; PRI ->人类、灵长类动物; BCT ->细菌.)
日期-记录的提交日期,格式类似于“1998年7月28日”
登录-序列的所有登录号列表。
nid -核苷酸标识号。
pid -Protein标识符号
版本-登录号+版本(即AB 01234.2)
db_source -有关记录来自的数据库的信息
gi -记录的NCBI gi标识符。
关键词-与记录相关的关键词列表。
片段-如果该记录是一个系列之一,则这是有关该记录是哪个片段的信息(类似于“1/6”)。
来源-序列的来源。
生物体-生物体的属和种(即“智人”)
分类学-生物体的分类分类列表,从一般开始,逐渐变得更具体。
引用-引用对象列表。
评论-包含有关记录的任何类型评论的文本。
features -组成功能表的功能列表。
base_counts -包含序列碱基计数的字符串。
origin -指定有关序列起源的信息的字符串。
序列-具有序列本身的字符串。
contig -RefSeq文件中CONTIG的位置信息字符串
项目-基因组测序项目编号(将于2009年被dbink交叉引用取代)。
dblinks -基因组测序项目编号和其他链接。(will替换2009年的项目信息)。
- GB_LINE_LENGTH = 79
- GB_BASE_INDENT = 12
- GB_FEATURE_INDENT = 21
- GB_INTERNAL_INDENT = 2
- GB_OTHER_INTERNAL_INDENT = 3
- GB_FEATURE_INTERNAL_INDENT = 5
- GB_SEQUENCE_INDENT = 9
- BASE_FORMAT = '%-12s'
- INTERNAL_FORMAT = ' %-10s'
- OTHER_INTERNAL_FORMAT = ' %-9s'
- BASE_FEATURE_FORMAT = '%-21s'
- INTERNAL_FEATURE_FORMAT = ' %-16s'
- SEQUENCE_FORMAT = '%9s'
- __init__()
初始化课程。
- __str__()
为记录提供SEN格式的输出选项。
其目标是提供一种简单的方法来读取基因库记录,以某种方式修改它,然后以“基因库格式”输出它。“我们正在努力实现这一目标,以便使用该函数输出的解析记录看起来与原始记录一模一样。
大部分输出基于格式描述信息:
- __firstlineno__ = 98
- __static_attributes__ = ('accession', 'base_counts', 'comment', 'contig', 'data_file_division', 'date', 'db_source', 'dblinks', 'definition', 'features', 'gi', 'keywords', 'locus', 'molecule_type', 'nid', 'organism', 'origin', 'pid', 'primary', 'projects', 'references', 'residue_type', 'segment', 'sequence', 'size', 'source', 'taxonomy', 'topology', 'version', 'wgs', 'wgs_scafld')
- class Bio.GenBank.Record.Reference
基类:
object
保存来自基因库参考的信息。
- 属性:
编号-参考文献列表中参考文献的编号。
碱基-参考序列中的碱基。
作者-包含所有作者的字符串。
consrTM -作者所属的联盟。
title -引用的标题。
journal -有关引用出现的期刊的信息。
medline_id -引用的medline id。
pubmed_id -引用的pubmed_id。
备注-关于引用的自由形式的备注。
- __init__()
初始化课程。
- __str__()
将引用转换为SEN格式字符串。
- __firstlineno__ = 498
- __static_attributes__ = ('authors', 'bases', 'consrtm', 'journal', 'medline_id', 'number', 'pubmed_id', 'remark', 'title')
- class Bio.GenBank.Record.Feature(key='', location='')
基类:
object
将有关功能的信息保存在基因库记录的功能表中。
- 属性:
key -功能的key名称(即来源)
location -指定要素位置的字符串。
限定符-要素中的限定符对象列表。
- __init__(key='', location='')
初始化课程。
- __repr__()
用于调试或记录的对象的表示。
- __str__()
将特征作为ESB格式字符串返回。
- __firstlineno__ = 609
- __static_attributes__ = ('key', 'location', 'qualifiers')
- class Bio.GenBank.Record.Qualifier(key='', value='')
基类:
object
在基因库功能中保存有关限定符的信息。
- 属性:
key -限定符的key名称(即/有机体=)
值-限定符的值(“Dictyosteum discoideum”)。
- __init__(key='', value='')
初始化课程。
- __repr__()
用于调试或记录的对象的表示。
- __str__()
将功能限定符作为ESB格式字符串返回。
- __firstlineno__ = 640
- __static_attributes__ = ('key', 'value')