Bio.SeqIO.InsdcIO模块¶
Bio.SeqIO支持“GenBank”和“embl”文件格式。
您需要通过Bio.SeqIO函数使用此模块。请注意,在内部,该模块调用Bio.GenBank来实际解析GenBank、EMBL和IMGT文件。
另请参阅:国际核苷酸序列数据库协作http://www.insdc.org/
基因银行http://www.ncbi.nlm.nih.gov/Genbank/
EMBL核苷酸序列数据库http://www.ebi.ac.uk/embl/
日本脱氧核糖核酸数据库http://www.ddbj.nig.ac.jp/
imgt(使用具有较长特征缩进的embl格式的变体)http://imgt.cines.fr/download/LIGM-DB/userman_doc.html http://imgt.cines.fr/download/LIGM-DB/ftable_doc.html http://www.ebi.ac.uk/imgt/hla/docs/manual.html
- class Bio.SeqIO.InsdcIO.GenBankIterator(source)¶
-
GenBank文件的解析器。
- __init__(source)¶
将Genbank文件分解为SeqRecord对象。
参数源是以文本模式或文件路径打开的类似文件的对象。从轨迹线到终止//的每个部分都将成为具有关联注释和特征的单个SeqRecord。
请注意,对于基因组或染色体,通常只有一条记录。
对于GenBank文件格式,这将由Bio.SeqIO内部调用:
>>> from Bio import SeqIO >>> for record in SeqIO.parse("GenBank/cor6_6.gb", "gb"): ... print(record.id) ... X55053.1 X62281.1 M81224.1 AJ237582.1 L31939.1 AF297471.1
等同地,
>>> with open("GenBank/cor6_6.gb") as handle: ... for record in GenBankIterator(handle): ... print(record.id) ... X55053.1 X62281.1 M81224.1 AJ237582.1 L31939.1 AF297471.1
- parse(handle)¶
开始解析文件,并返回SeqRecord生成器。
- __abstractmethods__ = frozenset({})¶
- class Bio.SeqIO.InsdcIO.EmblIterator(source)¶
-
EMBL文件的解析器。
- __init__(source)¶
将EMBL文件分解为SeqRecord对象。
参数源是以文本模式或文件路径打开的类似文件的对象。从轨迹线到终止//的每个部分都将成为具有关联注释和特征的单个SeqRecord。
请注意,对于基因组或染色体,通常只有一条记录。
对于EMBL文件格式,这将由Bio.SeqIO在内部调用:
>>> from Bio import SeqIO >>> for record in SeqIO.parse("EMBL/epo_prt_selection.embl", "embl"): ... print(record.id) ... A00022.1 A00028.1 A00031.1 A00034.1 A00060.1 A00071.1 A00072.1 A00078.1 CQ797900.1
等同地,
>>> with open("EMBL/epo_prt_selection.embl") as handle: ... for record in EmblIterator(handle): ... print(record.id) ... A00022.1 A00028.1 A00031.1 A00034.1 A00060.1 A00071.1 A00072.1 A00078.1 CQ797900.1
- parse(handle)¶
开始解析文件,并返回SeqRecord生成器。
- __abstractmethods__ = frozenset({})¶
- class Bio.SeqIO.InsdcIO.ImgtIterator(source)¶
-
IMGT文件的解析器。
- __init__(source)¶
将IMGT文件拆分为SeqRecord对象。
参数源是以文本模式或文件路径打开的类似文件的对象。从轨迹线到终止//的每个部分都将成为具有关联注释和特征的单个SeqRecord。
请注意,对于基因组或染色体,通常只有一条记录。
- parse(handle)¶
开始解析文件,并返回SeqRecord生成器。
- __abstractmethods__ = frozenset({})¶
- class Bio.SeqIO.InsdcIO.GenBankCdsFeatureIterator(source)¶
-
GenBank文件的解析器,为每个CDS功能创建一个SeqRecord。
- __init__(source)¶
将Genbank文件分解为每个CDS功能的SeqRecord对象。
参数源是以文本模式或文件路径打开的类似文件的对象。
从轨迹线到终止//的每个部分都可以包含许多CDS功能。这些与所述的氨基酸翻译序列(如果给定)一起返回。
- parse(handle)¶
开始解析文件,并返回SeqRecord生成器。
- __abstractmethods__ = frozenset({})¶
- class Bio.SeqIO.InsdcIO.EmblCdsFeatureIterator(source)¶
-
EMBL文件的解析器,为每个CDS功能创建一个SeqRecord。
- __init__(source)¶
将EMBL文件分解为每个CDS功能的SeqRecord对象。
参数源是以文本模式或文件路径打开的类似文件的对象。
从轨迹线到终止//的每个部分都可以包含许多CDS功能。这些与所述的氨基酸翻译序列(如果给定)一起返回。
- parse(handle)¶
开始解析文件,并返回SeqRecord生成器。
- __abstractmethods__ = frozenset({})¶
- class Bio.SeqIO.InsdcIO.GenBankWriter(target, mode='w')¶
基类:
_InsdcWriter
基因库撰稿人。
- HEADER_WIDTH = 12¶
- QUALIFIER_INDENT = 21¶
- STRUCTURED_COMMENT_START = '-START##'¶
- STRUCTURED_COMMENT_END = '-END##'¶
- STRUCTURED_COMMENT_DELIM = ' :: '¶
- LETTERS_PER_LINE = 60¶
- SEQUENCE_INDENT = 9¶
- write_record(record)¶
将单个记录写入输出文件。
- class Bio.SeqIO.InsdcIO.EmblWriter(target, mode='w')¶
基类:
_InsdcWriter
Embl编剧。
- HEADER_WIDTH = 5¶
- QUALIFIER_INDENT = 21¶
- QUALIFIER_INDENT_STR = 'FT '¶
- QUALIFIER_INDENT_TMP = 'FT %s '¶
- FEATURE_HEADER = 'FH Key Location/Qualifiers\nFH\n'¶
- LETTERS_PER_BLOCK = 10¶
- BLOCKS_PER_LINE = 6¶
- LETTERS_PER_LINE = 60¶
- POSITION_PADDING = 10¶
- write_record(record)¶
将单个记录写入输出文件。