Bio.SeqIO.InsdcIO模块
SeqIO支持“genbank”和“embl”文件格式。
您需要通过Bio.SeqIO功能使用此模块。请注意,该模块在内部调用Bio. Gen来对ESB、EmbL和IMGT文件进行实际解析。
另请参阅:国际核苷酸序列数据库合作组织http://www.insdc.org/
基因银行http://www.ncbi.nlm.nih.gov/Genbank/
EmbL核苷酸序列数据库http://www.ebi.ac.uk/embl/
DDBJ(日本DNA数据库)http://www.ddbj.nig.ac.jp/
IMGT(使用具有更长特征凹痕的MBE格式变体)http://imgt.cines.fr/download/LIGM-DB/userman_doc.html http://imgt.cines.fr/download/LIGM-DB/ftable_doc.html http://www.ebi.ac.uk/imgt/hla/docs/manual.html
- class Bio.SeqIO.InsdcIO.GenBankIterator(source)
-
基因库文件的解析器。
- modes = 't'
- __init__(source)
将Genbank文件分解为SeqRecord对象。
参数源是以文本模式打开的类似文件的对象或文件的路径。从LOCUS行到终止//的每个部分都成为一个具有相关注释和功能的SeqRecord。
请注意,对于基因组或染色体,通常只有一条记录。
这由Bio.SeqIO在内部调用,以获取ESB文件格式:
>>> from Bio import SeqIO >>> for record in SeqIO.parse("GenBank/cor6_6.gb", "gb"): ... print(record.id) ... X55053.1 X62281.1 M81224.1 AJ237582.1 L31939.1 AF297471.1
同等地,
>>> with open("GenBank/cor6_6.gb") as handle: ... for record in GenBankIterator(handle): ... print(record.id) ... X55053.1 X62281.1 M81224.1 AJ237582.1 L31939.1 AF297471.1
- __next__()
返回下一个SeqRecord。
- __abstractmethods__ = frozenset({})
- __annotations__ = {}
- __firstlineno__ = 62
- __parameters__ = ()
- __static_attributes__ = ('records',)
- class Bio.SeqIO.InsdcIO.EmblIterator(source)
-
EmbL文件的解析器。
- modes = 't'
- __init__(source)
将EmbL文件分解为SeqRecord对象。
参数源是以文本模式打开的类似文件的对象或文件的路径。从LOCUS行到终止//的每个部分都成为一个具有相关注释和功能的SeqRecord。
请注意,对于基因组或染色体,通常只有一条记录。
对于EMBL文件格式,Bio.SeqIO在内部调用该函数:
>>> from Bio import SeqIO >>> for record in SeqIO.parse("EMBL/epo_prt_selection.embl", "embl"): ... print(record.id) ... A00022.1 A00028.1 A00031.1 A00034.1 A00060.1 A00071.1 A00072.1 A00078.1 CQ797900.1
同等地,
>>> with open("EMBL/epo_prt_selection.embl") as handle: ... for record in EmblIterator(handle): ... print(record.id) ... A00022.1 A00028.1 A00031.1 A00034.1 A00060.1 A00071.1 A00072.1 A00078.1 CQ797900.1
- __next__()
返回下一个SeqRecord。
- __abstractmethods__ = frozenset({})
- __annotations__ = {}
- __firstlineno__ = 112
- __parameters__ = ()
- __static_attributes__ = ('records',)
- class Bio.SeqIO.InsdcIO.ImgtIterator(source)
-
IMGT文件的解析器。
- modes = 't'
- __init__(source)
将IMGT文件分解为SeqRecord对象。
参数源是以文本模式打开的类似文件的对象或文件的路径。从LOCUS行到终止//的每个部分都成为一个具有相关注释和功能的SeqRecord。
请注意,对于基因组或染色体,通常只有一条记录。
- __next__()
返回下一个SeqRecord。
- __abstractmethods__ = frozenset({})
- __annotations__ = {}
- __firstlineno__ = 168
- __parameters__ = ()
- __static_attributes__ = ('records',)
- class Bio.SeqIO.InsdcIO.GenBankCdsFeatureIterator(source)
-
针对ESB文件进行解析,为每个CDS功能创建SeqRecord。
- modes = 't'
- __init__(source)
将Genbank文件分解为每个CDS功能的SeqRecord对象。
参数源是以文本模式打开的类似文件的对象或文件的路径。
从LOCUS行到终止//的每个部分都可以包含许多CDS功能。 这些与指定的氨基酸翻译序列(如果给出)一样返回。
- __next__()
返回下一个SeqRecord。
- __abstractmethods__ = frozenset({})
- __annotations__ = {}
- __firstlineno__ = 191
- __parameters__ = ()
- __static_attributes__ = ('records',)
- class Bio.SeqIO.InsdcIO.EmblCdsFeatureIterator(source)
-
EmbL文件解析器,为每个CDS功能创建SeqRecord。
- modes = 't'
- __init__(source)
针对每个CDS功能将EmbL文件分解为SeqRecord对象。
参数源是以文本模式打开的类似文件的对象或文件的路径。
从LOCUS行到终止//的每个部分都可以包含许多CDS功能。 这些与指定的氨基酸翻译序列(如果给出)一样返回。
- __next__()
返回下一个SeqRecord。
- __abstractmethods__ = frozenset({})
- __annotations__ = {}
- __firstlineno__ = 213
- __parameters__ = ()
- __static_attributes__ = ('records',)
- class Bio.SeqIO.InsdcIO.GenBankWriter(target: IO | PathLike | str | bytes)
基类:
_InsdcWriter
基因库作家。
- HEADER_WIDTH = 12
- QUALIFIER_INDENT = 21
- STRUCTURED_COMMENT_START = '-START##'
- STRUCTURED_COMMENT_END = '-END##'
- STRUCTURED_COMMENT_DELIM = ' :: '
- LETTERS_PER_LINE = 60
- SEQUENCE_INDENT = 9
- write_record(record)
将单个记录写入输出文件。
- __abstractmethods__ = frozenset({})
- __annotations__ = {}
- __firstlineno__ = 576
- __parameters__ = ()
- __static_attributes__ = ()
- class Bio.SeqIO.InsdcIO.EmblWriter(target: IO | PathLike | str | bytes)
基类:
_InsdcWriter
EmbL作家。
- HEADER_WIDTH = 5
- QUALIFIER_INDENT = 21
- QUALIFIER_INDENT_STR = 'FT '
- QUALIFIER_INDENT_TMP = 'FT %s '
- FEATURE_HEADER = 'FH Key Location/Qualifiers\nFH\n'
- LETTERS_PER_BLOCK = 10
- BLOCKS_PER_LINE = 6
- LETTERS_PER_LINE = 60
- POSITION_PADDING = 10
- write_record(record)
将单个记录写入输出文件。
- __abstractmethods__ = frozenset({})
- __annotations__ = {}
- __firstlineno__ = 1166
- __parameters__ = ()
- __static_attributes__ = ()
- class Bio.SeqIO.InsdcIO.ImgtWriter(target: IO | PathLike | str | bytes)
基类:
EmblWriter
IMGT编写器(MBE格式变体)。
- HEADER_WIDTH = 5
- QUALIFIER_INDENT = 25
- QUALIFIER_INDENT_STR = 'FT '
- QUALIFIER_INDENT_TMP = 'FT %s '
- FEATURE_HEADER = 'FH Key Location/Qualifiers\nFH\n'
- __abstractmethods__ = frozenset({})
- __annotations__ = {}
- __firstlineno__ = 1521
- __parameters__ = ()
- __static_attributes__ = ()