Bio.SeqIO.SeqXmlIO模块

Bio.SeqIO支持“seqxml”文件格式SeqXML。

此模块用于将SeqXML格式的文件作为SeqRecord对象进行读写,预计通过Bio.SeqIO接口使用。

SeqXML是一种轻量级XML格式,应该是FASTA文件的替代格式。有关更多信息,请参阅http://www.seqXML.org和施密特等人(2011年),https://doi.org/10.1093/bib/bbr025

class Bio.SeqIO.SeqXmlIO.ContentHandler

基类:ContentHandler

处理解析器生成的XML事件(私有)。

__init__()

创建一个处理程序来处理XML事件。

startDocument()

在找到XML声明时设置XML处理程序。

startSeqXMLElement(name, qname, attrs)

处理seqXML元素的开始。

endSeqXMLElement(name, qname)

处理seqXML元素的末尾。

startEntryElement(name, qname, attrs)

使用id和可选的条目源(私有)设置新条目。

endEntryElement(name, qname)

处理Entry元素的末尾。

startEntryFieldElement(name, qname, attrs)

接收条目元素的字段并将其转发。

startSpeciesElement(attrs)

解析物种信息。

endSpeciesElement(name, qname)

处理物种元素的末端。

startDescriptionElement(attrs)

解析描述。

endDescriptionElement(name, qname)

处理描述元素的末尾。

startSequenceElement(attrs)

解析DNA、RNA或蛋白质序列。

endSequenceElement(name, qname)

处理序列元素的结尾。

startDBRefElement(attrs)

解析数据库交叉引用。

endDBRefElement(name, qname)

处理DBRef元素的结尾。

startPropertyElement(attrs)

处理属性元素的开始。

endPropertyElement(name, qname)

处理属性元素的结尾。

characters(data)

处理字符数据。

class Bio.SeqIO.SeqXmlIO.SeqXmlIterator(stream_or_path, namespace=None)

基类:SequenceIterator

seqXML文件的解析器。

解析seqXML文件并创建SeqRecords。假定seqXML有效,请事先验证。假设一条记录的所有信息都可以在一个记录元素或以上找到。当到达元素的开始标记时,会调用两种类型的方法。要在到达元素的结束标记之前仅接收元素的属性,请执行IMPLEMENT_ATTR_TAGNAME。要获得DOM树形式的元素及其子元素,请实现_ELEM_TAGNAME。DOM树中的所有内容都不会触发任何进一步的方法调用。

BLOCK = 1024
__init__(stream_or_path, namespace=None)

创建对象并初始化XML解析器。

parse(handle)

开始解析文件,并返回SeqRecord生成器。

iterate(handle)

迭代XML文件中的记录。

__abstractmethods__ = frozenset({})
class Bio.SeqIO.SeqXmlIO.SeqXmlWriter(target, source=None, source_version=None, species=None, ncbiTaxId=None)

基类:SequenceWriter

将SeqRecords写入seqXML文件。

SeqXML需要SeqRecord注释来指定分子类型;分子类型需要包含术语“DNA”、“RNA”或“蛋白质”。

__init__(target, source=None, source_version=None, species=None, ncbiTaxId=None)

创建对象并启动XML生成器。

参数:
  • 目标-以二进制模式打开的输出流,或文件的路径。

  • 源-文件的源程序/数据库,例如UniProt。

  • SOURCE_VERSION-数据来源的源程序或数据库的版本或版本号。

  • 物种-文件中所有条目的起源物种的学名。

  • ncbiTaxId-原产地物种的NCBI分类标识符。

write_header()

使用文档元数据写入根节点。

write_record(record)

写一条记录。

关闭根节点并完成XML文档。