Bio.SeqIO.SeqXmlIO模块¶
Bio.SeqIO支持“seqxml”文件格式SeqXML。
此模块用于将SeqXML格式的文件作为SeqRecord对象进行读写,预计通过Bio.SeqIO接口使用。
SeqXML是一种轻量级XML格式,应该是FASTA文件的替代格式。有关更多信息,请参阅http://www.seqXML.org和施密特等人(2011年),https://doi.org/10.1093/bib/bbr025
- class Bio.SeqIO.SeqXmlIO.ContentHandler¶
基类:
ContentHandler
处理解析器生成的XML事件(私有)。
- __init__()¶
创建一个处理程序来处理XML事件。
- startDocument()¶
在找到XML声明时设置XML处理程序。
- startSeqXMLElement(name, qname, attrs)¶
处理seqXML元素的开始。
- endSeqXMLElement(name, qname)¶
处理seqXML元素的末尾。
- startEntryElement(name, qname, attrs)¶
使用id和可选的条目源(私有)设置新条目。
- endEntryElement(name, qname)¶
处理Entry元素的末尾。
- startEntryFieldElement(name, qname, attrs)¶
接收条目元素的字段并将其转发。
- startSpeciesElement(attrs)¶
解析物种信息。
- endSpeciesElement(name, qname)¶
处理物种元素的末端。
- startDescriptionElement(attrs)¶
解析描述。
- endDescriptionElement(name, qname)¶
处理描述元素的末尾。
- startSequenceElement(attrs)¶
解析DNA、RNA或蛋白质序列。
- endSequenceElement(name, qname)¶
处理序列元素的结尾。
- startDBRefElement(attrs)¶
解析数据库交叉引用。
- endDBRefElement(name, qname)¶
处理DBRef元素的结尾。
- startPropertyElement(attrs)¶
处理属性元素的开始。
- endPropertyElement(name, qname)¶
处理属性元素的结尾。
- characters(data)¶
处理字符数据。
- class Bio.SeqIO.SeqXmlIO.SeqXmlIterator(stream_or_path, namespace=None)¶
-
seqXML文件的解析器。
解析seqXML文件并创建SeqRecords。假定seqXML有效,请事先验证。假设一条记录的所有信息都可以在一个记录元素或以上找到。当到达元素的开始标记时,会调用两种类型的方法。要在到达元素的结束标记之前仅接收元素的属性,请执行IMPLEMENT_ATTR_TAGNAME。要获得DOM树形式的元素及其子元素,请实现_ELEM_TAGNAME。DOM树中的所有内容都不会触发任何进一步的方法调用。
- BLOCK = 1024¶
- __init__(stream_or_path, namespace=None)¶
创建对象并初始化XML解析器。
- parse(handle)¶
开始解析文件,并返回SeqRecord生成器。
- iterate(handle)¶
迭代XML文件中的记录。
- __abstractmethods__ = frozenset({})¶
- class Bio.SeqIO.SeqXmlIO.SeqXmlWriter(target, source=None, source_version=None, species=None, ncbiTaxId=None)¶
-
将SeqRecords写入seqXML文件。
SeqXML需要SeqRecord注释来指定分子类型;分子类型需要包含术语“DNA”、“RNA”或“蛋白质”。
- __init__(target, source=None, source_version=None, species=None, ncbiTaxId=None)¶
创建对象并启动XML生成器。
- 参数:
目标-以二进制模式打开的输出流,或文件的路径。
源-文件的源程序/数据库,例如UniProt。
SOURCE_VERSION-数据来源的源程序或数据库的版本或版本号。
物种-文件中所有条目的起源物种的学名。
ncbiTaxId-原产地物种的NCBI分类标识符。
- write_header()¶
使用文档元数据写入根节点。
- write_record(record)¶
写一条记录。
关闭根节点并完成XML文档。