生物。基因库。记录模块

以简单的格式保存SEN数据。

职业:
  • 记录-基因库记录中的所有信息。

  • 引用-保存记录的引用数据。

  • 特征-将信息保存在特征表中。

  • 简化器-功能上的简化器。

class Bio.GenBank.Record.Record

基类:object

以与原始记录类似的格式保存基因库信息。

Record类的目的是让您在仅对查看ESB数据感兴趣时轻松获取数据。

属性:
  • locus -在SEN记录中LOCUS关键字后面指定的名称。这可能是登录号、克隆ID或其他内容。

  • 大小-记录的大小。

  • residue_style-构成此记录中序列的残基类型。通常类似于RNA、DNA或蛋白质,但可能像“ss-RNA环”一样深奥。

  • data_file_division -此记录在基因库中存储的部门(即印尼国家电力局->植物; PRI ->人类、灵长类动物; BCT ->细菌.)

  • 日期-记录的提交日期,格式类似于“1998年7月28日”

  • 登录-序列的所有登录号列表。

  • nid -核苷酸标识号。

  • pid -Protein标识符号

  • 版本-登录号+版本(即AB 01234.2)

  • db_source -有关记录来自的数据库的信息

  • gi -记录的NCBI gi标识符。

  • 关键词-与记录相关的关键词列表。

  • 片段-如果该记录是一个系列之一,则这是有关该记录是哪个片段的信息(类似于“1/6”)。

  • 来源-序列的来源。

  • 生物体-生物体的属和种(即“智人”)

  • 分类学-生物体的分类分类列表,从一般开始,逐渐变得更具体。

  • 引用-引用对象列表。

  • 评论-包含有关记录的任何类型评论的文本。

  • features -组成功能表的功能列表。

  • base_counts -包含序列碱基计数的字符串。

  • origin -指定有关序列起源的信息的字符串。

  • 序列-具有序列本身的字符串。

  • contig -RefSeq文件中CONTIG的位置信息字符串

  • 项目-基因组测序项目编号(将于2009年被dbink交叉引用取代)。

  • dblinks -基因组测序项目编号和其他链接。(will替换2009年的项目信息)。

GB_LINE_LENGTH = 79
GB_BASE_INDENT = 12
GB_FEATURE_INDENT = 21
GB_INTERNAL_INDENT = 2
GB_OTHER_INTERNAL_INDENT = 3
GB_FEATURE_INTERNAL_INDENT = 5
GB_SEQUENCE_INDENT = 9
BASE_FORMAT = '%-12s'
INTERNAL_FORMAT = '  %-10s'
OTHER_INTERNAL_FORMAT = '   %-9s'
BASE_FEATURE_FORMAT = '%-21s'
INTERNAL_FEATURE_FORMAT = '     %-16s'
SEQUENCE_FORMAT = '%9s'
__init__()

初始化课程。

__str__()

为记录提供SEN格式的输出选项。

其目标是提供一种简单的方法来读取基因库记录,以某种方式修改它,然后以“基因库格式”输出它。“我们正在努力实现这一目标,以便使用该函数输出的解析记录看起来与原始记录一模一样。

大部分输出基于格式描述信息:

ftp://ncbi.nlm.nih.gov/genbank/gbrel.txt

__firstlineno__ = 98
__static_attributes__ = ('accession', 'base_counts', 'comment', 'contig', 'data_file_division', 'date', 'db_source', 'dblinks', 'definition', 'features', 'gi', 'keywords', 'locus', 'molecule_type', 'nid', 'organism', 'origin', 'pid', 'primary', 'projects', 'references', 'residue_type', 'segment', 'sequence', 'size', 'source', 'taxonomy', 'topology', 'version', 'wgs', 'wgs_scafld')
class Bio.GenBank.Record.Reference

基类:object

保存来自基因库参考的信息。

属性:
  • 编号-参考文献列表中参考文献的编号。

  • 碱基-参考序列中的碱基。

  • 作者-包含所有作者的字符串。

  • consrTM -作者所属的联盟。

  • title -引用的标题。

  • journal -有关引用出现的期刊的信息。

  • medline_id -引用的medline id。

  • pubmed_id -引用的pubmed_id。

  • 备注-关于引用的自由形式的备注。

__init__()

初始化课程。

__str__()

将引用转换为SEN格式字符串。

__firstlineno__ = 498
__static_attributes__ = ('authors', 'bases', 'consrtm', 'journal', 'medline_id', 'number', 'pubmed_id', 'remark', 'title')
class Bio.GenBank.Record.Feature(key='', location='')

基类:object

将有关功能的信息保存在基因库记录的功能表中。

属性:
  • key -功能的key名称(即来源)

  • location -指定要素位置的字符串。

  • 限定符-要素中的限定符对象列表。

__init__(key='', location='')

初始化课程。

__repr__()

用于调试或记录的对象的表示。

__str__()

将特征作为ESB格式字符串返回。

__firstlineno__ = 609
__static_attributes__ = ('key', 'location', 'qualifiers')
class Bio.GenBank.Record.Qualifier(key='', value='')

基类:object

在基因库功能中保存有关限定符的信息。

属性:
  • key -限定符的key名称(即/有机体=)

  • 值-限定符的值(“Dictyosteum discoideum”)。

__init__(key='', value='')

初始化课程。

__repr__()

用于调试或记录的对象的表示。

__str__()

将功能限定符作为ESB格式字符串返回。

__firstlineno__ = 640
__static_attributes__ = ('key', 'value')