Bio.SeqIO.InsdcIO模块¶

Bio.SeqIO支持“GenBank”和“embl”文件格式。

您需要通过Bio.SeqIO函数使用此模块。请注意，在内部，该模块调用Bio.GenBank来实际解析GenBank、EMBL和IMGT文件。

另请参阅：国际核苷酸序列数据库协作http://www.insdc.org/

基因银行http://www.ncbi.nlm.nih.gov/Genbank/

EMBL核苷酸序列数据库http://www.ebi.ac.uk/embl/

日本脱氧核糖核酸数据库http://www.ddbj.nig.ac.jp/

imgt(使用具有较长特征缩进的embl格式的变体)http://imgt.cines.fr/download/LIGM-DB/userman_doc.html http://imgt.cines.fr/download/LIGM-DB/ftable_doc.html http://www.ebi.ac.uk/imgt/hla/docs/manual.html

class Bio.SeqIO.InsdcIO.GenBankIterator(source)¶

基类：SequenceIterator

GenBank文件的解析器。

__init__(source)¶

将Genbank文件分解为SeqRecord对象。

参数源是以文本模式或文件路径打开的类似文件的对象。从轨迹线到终止//的每个部分都将成为具有关联注释和特征的单个SeqRecord。

请注意，对于基因组或染色体，通常只有一条记录。

对于GenBank文件格式，这将由Bio.SeqIO内部调用：

>>> from Bio import SeqIO
>>> for record in SeqIO.parse("GenBank/cor6_6.gb", "gb"):
...     print(record.id)
...
X55053.1
X62281.1
M81224.1
AJ237582.1
L31939.1
AF297471.1

等同地，

>>> with open("GenBank/cor6_6.gb") as handle:
...     for record in GenBankIterator(handle):
...         print(record.id)
...
X55053.1
X62281.1
M81224.1
AJ237582.1
L31939.1
AF297471.1

parse(handle)¶: 开始解析文件，并返回SeqRecord生成器。

__abstractmethods__ = frozenset({})¶

class Bio.SeqIO.InsdcIO.EmblIterator(source)¶

基类：SequenceIterator

EMBL文件的解析器。

__init__(source)¶

将EMBL文件分解为SeqRecord对象。

参数源是以文本模式或文件路径打开的类似文件的对象。从轨迹线到终止//的每个部分都将成为具有关联注释和特征的单个SeqRecord。

请注意，对于基因组或染色体，通常只有一条记录。

对于EMBL文件格式，这将由Bio.SeqIO在内部调用：

>>> from Bio import SeqIO
>>> for record in SeqIO.parse("EMBL/epo_prt_selection.embl", "embl"):
...     print(record.id)
...
A00022.1
A00028.1
A00031.1
A00034.1
A00060.1
A00071.1
A00072.1
A00078.1
CQ797900.1

等同地，

>>> with open("EMBL/epo_prt_selection.embl") as handle:
...     for record in EmblIterator(handle):
...         print(record.id)
...
A00022.1
A00028.1
A00031.1
A00034.1
A00060.1
A00071.1
A00072.1
A00078.1
CQ797900.1

parse(handle)¶: 开始解析文件，并返回SeqRecord生成器。

__abstractmethods__ = frozenset({})¶

class Bio.SeqIO.InsdcIO.ImgtIterator(source)¶

基类：SequenceIterator

IMGT文件的解析器。

__init__(source)¶

将IMGT文件拆分为SeqRecord对象。

参数源是以文本模式或文件路径打开的类似文件的对象。从轨迹线到终止//的每个部分都将成为具有关联注释和特征的单个SeqRecord。

请注意，对于基因组或染色体，通常只有一条记录。

parse(handle)¶: 开始解析文件，并返回SeqRecord生成器。

__abstractmethods__ = frozenset({})¶

class Bio.SeqIO.InsdcIO.GenBankCdsFeatureIterator(source)¶

基类：SequenceIterator

GenBank文件的解析器，为每个CDS功能创建一个SeqRecord。

__init__(source)¶

将Genbank文件分解为每个CDS功能的SeqRecord对象。

参数源是以文本模式或文件路径打开的类似文件的对象。

从轨迹线到终止//的每个部分都可以包含许多CDS功能。这些与所述的氨基酸翻译序列(如果给定)一起返回。

parse(handle)¶: 开始解析文件，并返回SeqRecord生成器。

__abstractmethods__ = frozenset({})¶

class Bio.SeqIO.InsdcIO.EmblCdsFeatureIterator(source)¶

基类：SequenceIterator

EMBL文件的解析器，为每个CDS功能创建一个SeqRecord。

__init__(source)¶

将EMBL文件分解为每个CDS功能的SeqRecord对象。

参数源是以文本模式或文件路径打开的类似文件的对象。

从轨迹线到终止//的每个部分都可以包含许多CDS功能。这些与所述的氨基酸翻译序列(如果给定)一起返回。

parse(handle)¶: 开始解析文件，并返回SeqRecord生成器。

__abstractmethods__ = frozenset({})¶

class Bio.SeqIO.InsdcIO.GenBankWriter(target, mode='w')¶

基类：_InsdcWriter

基因库撰稿人。

HEADER_WIDTH = 12¶

QUALIFIER_INDENT = 21¶

STRUCTURED_COMMENT_START = '-START##'¶

STRUCTURED_COMMENT_END = '-END##'¶

STRUCTURED_COMMENT_DELIM = ' :: '¶

LETTERS_PER_LINE = 60¶

SEQUENCE_INDENT = 9¶

write_record(record)¶: 将单个记录写入输出文件。

class Bio.SeqIO.InsdcIO.EmblWriter(target, mode='w')¶

基类：_InsdcWriter

Embl编剧。

HEADER_WIDTH = 5¶

QUALIFIER_INDENT = 21¶

QUALIFIER_INDENT_STR = 'FT '¶

QUALIFIER_INDENT_TMP = 'FT %s '¶

FEATURE_HEADER = 'FH Key Location/Qualifiers\nFH\n'¶

LETTERS_PER_BLOCK = 10¶

BLOCKS_PER_LINE = 6¶

LETTERS_PER_LINE = 60¶

POSITION_PADDING = 10¶

write_record(record)¶: 将单个记录写入输出文件。

class Bio.SeqIO.InsdcIO.ImgtWriter(target, mode='w')¶

基类：EmblWriter

IMGT编写器(EMBL格式变体)。

HEADER_WIDTH = 5¶

QUALIFIER_INDENT = 25¶

QUALIFIER_INDENT_STR = 'FT '¶

QUALIFIER_INDENT_TMP = 'FT %s '¶

FEATURE_HEADER = 'FH Key Location/Qualifiers\nFH\n'¶