Bio.Phylo.PhyloXML模块

与phyloXML元素对应的类。

另请参阅

官方规格:

http://phyloxml.org/

期刊文章:

韩和兹马塞克(2009年),https://doi.org/10.1186/1471-2105-10-356

exception Bio.Phylo.PhyloXML.PhyloXMLWarning

基类:BiopythonWarning

不符合phyloXML规范的警告。

class Bio.Phylo.PhyloXML.PhyloElement

基类:TreeElement

所有PhyloXML对象的基类。

class Bio.Phylo.PhyloXML.Phyloxml(attributes, phylogenies=None, other=None)

基类:PhyloElement

PhyloXML文档的根节点。

包含任意数量的发展史元素,后跟可能是来自其他命名空间的元素。

参数:
属性DICT

(XML命名空间定义)

系统发育学列表

系统发育树

其他列表

任意非phyloXML元素(如果有的话)

__init__(attributes, phylogenies=None, other=None)

初始化PhyloXML对象的参数。

__getitem__(index)

通过索引或名称获得系统发展史。

__iter__()

遍历此对象中的系统发生树。

__len__()

返回此对象中的系统发育树数。

__str__()

返回对象中系统发展史的名称。

class Bio.Phylo.PhyloXML.Other(tag, namespace=None, attributes=None, value=None, children=None)

基类:PhyloElement

树中非phyloXML元素的容器。

通常,另一个对象将具有“value”或非空的“Children”列表,但不能同时具有这两个列表。不过,这在这里没有强制执行。

参数:
标签字符串

XML节点的本地标记

命名空间字符串

节点的XML命名空间--不应该是默认的phyloXML命名空间。

属性字符串词典

XML节点上的属性

价值字符串

直接包含在此XML节点中的文本

儿童列表

子节点(如果有的话)(也 Other 实例)

__init__(tag, namespace=None, attributes=None, value=None, children=None)

初始化非phyloXML元素的值。

__iter__()

循环访问此对象的子级(如果有的话)。

class Bio.Phylo.PhyloXML.Phylogeny(root=None, rooted=True, rerootable=None, branch_length_unit=None, type=None, name=None, id=None, description=None, date=None, confidences=None, clade_relations=None, sequence_relations=None, properties=None, other=None)

基类:PhyloElement, Tree

一个系统发育树。

参数:
根部分支

此树的根节点/分支

扎根布尔尔

如果此树是根树,则为True

可重新旋转的布尔尔

如果此树是可重写的,则为True

branch_length_unit字符串

分支上的BRANCH_LENGTH值的单位

名字字符串

此树的标识符,不要求唯一

ID号ID号

此树的唯一标识符

描述字符串

纯文本描述

日期日期

此树的根节点的日期

信任列表

此树的信任对象

clade_relations列表

CladeRelation对象

sequence_relations列表

SequenceRelation对象

属性列表

属性对象

其他列表

非phyloXML元素(类型 Other )

__init__(root=None, rooted=True, rerootable=None, branch_length_unit=None, type=None, name=None, id=None, description=None, date=None, confidences=None, clade_relations=None, sequence_relations=None, properties=None, other=None)

初始化系统发育树对象的值。

classmethod from_tree(tree, **kwargs)

根据一棵树(从Newick/Nexus或BaseTree)创建新的系统发育图。

关键字参数是常见的 Phylogeny 构造函数参数。

classmethod from_clade(clade, **kwargs)

在给定Newick或BaseTree Clade对象的情况下创建新的系统发展史。

关键字参数是常见的 PhyloXML.Clade 构造函数参数。

as_phyloxml()

返回此树,这是一个与PhyloXML兼容的系统发展史对象。

重写 BaseTree 方法。

to_phyloxml_container(**kwargs)

创建一个仅包含此系统发展史的新Phyloxml对象。

to_alignment()

根据此树中的比对序列构建比对。

property confidence

相当于自信 [0] 如果只有1个值(私有)。

另请参阅: Clade.confidenceClade.taxonomy

class Bio.Phylo.PhyloXML.Clade(branch_length=None, id_source=None, name=None, width=None, color=None, node_id=None, events=None, binary_characters=None, date=None, confidences=None, taxonomies=None, sequences=None, distributions=None, references=None, properties=None, clades=None, other=None)

基类:PhyloElement, Clade

描述当前系统发育树的一个分支。

递归使用,描述系统发育树的拓扑。

两者都有 colorwidth 元素应由客户端代码解释为应用于整个分支,包括所有后代,除非在子分支中被覆盖。此模块不会自动将这些属性分配给子分支来实现此级联--您也不应该这样做。

参数:
branch_length

此分支的父分支长度

id_source

将其他元素链接到一个分支(在XML级别)

名字字符串

此分支的短标签

信任置信度对象列表

用于指示对分支/父分支的支持。

宽度浮动

此分支的分支宽度(包括来自父级的分支)

颜色BranchColor

用于此分支的图形显示的颜色

node_id

此分支的根节点的唯一标识符

分类学列表

分类对象

序列列表

序列对象

活动活动

描述该分支的根节点/父分支上的基因复制等事件

binary_charactersBinaryCharacters

二进制字符

分配分发对象列表

此分支的分布情况

日期日期

此分支的根节点的日期

参考文献列表

参考对象

属性列表

属性对象

分支列出Clade对象

子分支

其他其他对象列表

非phyloXML对象

__init__(branch_length=None, id_source=None, name=None, width=None, color=None, node_id=None, events=None, binary_characters=None, date=None, confidences=None, taxonomies=None, sequences=None, distributions=None, references=None, properties=None, clades=None, other=None)

初始化Clade对象的值。

classmethod from_clade(clade, **kwargs)

从Newick或BaseTree Clade对象创建新的PhyloXML Clade。

关键字参数是常用的PhyloXML Clade构造函数参数。

to_phylogeny(**kwargs)

创建一个只包含这个支系的新的系统发展史。

property confidence

返回置信度值(私有)。

property taxonomy

获取该分支的分类列表(私有)。

class Bio.Phylo.PhyloXML.BranchColor(*args, **kwargs)

基类:PhyloElement, BranchColor

管理树枝的颜色。

__init__(*args, **kwargs)

初始化BranchColor对象的参数。

class Bio.Phylo.PhyloXML.Accession(value, source)

基类:PhyloElement

捕获序列标识符中的本地部分。

示例:In UniProtKB:P17304 ,Accession实例属性 value 是‘P17304’,并且 source 属性为“UniProtKB”。

__init__(value, source)

初始化访问对象的值。

__str__()

显示类名和标识属性。

class Bio.Phylo.PhyloXML.Annotation(ref=None, source=None, evidence=None, type=None, desc=None, confidence=None, uri=None, properties=None)

基类:PhyloElement

分子序列的注释。

建议使用可选的“ref”属性进行批注。

参数:
参考字符串

参考字符串,例如“GO:0008270”,“KEGG:四氯乙烯降解”,“EC:1.1.1.1”

来源字符串

此批注的纯文本源

证据应力

将证据描述为自由文本(例如,“实验性”)

说明字符串

自由文本说明

信心信心

说明支持的类型和值(类型置信度)

属性列表

来自外部资源的类型化和引用的批注

URIURI

链接

re_ref = re.compile('[a-zA-Z0-9_]+:[a-zA-Z0-9_\\.\\-\\s]+')
__init__(ref=None, source=None, evidence=None, type=None, desc=None, confidence=None, uri=None, properties=None)

初始化Annotation对象的值。

class Bio.Phylo.PhyloXML.BinaryCharacters(type=None, gained_count=None, lost_count=None, present_count=None, absent_count=None, gained=None, lost=None, present=None, absent=None)

基类:PhyloElement

分支根部的二进制字符。

在分支的根部存在、获得和丢失的二进制字符的名称和/或计数。

__init__(type=None, gained_count=None, lost_count=None, present_count=None, absent_count=None, gained=None, lost=None, present=None, absent=None)

初始化BinaryCharacters对象的值。

class Bio.Phylo.PhyloXML.CladeRelation(type, id_ref_0, id_ref_1, distance=None, confidence=None)

基类:PhyloElement

表示两个分支之间的类型化关系。

例如,这可用于描述一个分支的多个父级。

__init__(type, id_ref_0, id_ref_1, distance=None, confidence=None)

初始化CladeRelation对象的值。

class Bio.Phylo.PhyloXML.Confidence(value, type='unknown')

基类:PhyloElement

一种通用的信任元素。

例如,这可用于表示分支的引导支持值(在这种情况下 type 属性为“bootstrap”)。

参数:
价值浮动

置信度值

类型字符串

置信度类型的标签,例如‘Bootstrap’

__init__(value, type='unknown')

初始化置信度对象的值。

__hash__()

返回对象的哈希值。

哈希值是整数。它们用于在字典查找期间快速比较字典键。比较相等的数值具有相同的散列值(即使它们的类型不同,如1和1.0的情况)。

__eq__(other)

检查置信度对象之间是否相等。

__ne__(other)

检查两个置信度对象之间的不等性。

__lt__(other)

如果置信度小于其他置信度,则返回True。

__le__(other)

如果置信度小于或等于其他置信度,则返回True。

__gt__(other)

如果信心大于其他信心,则返回True。

__ge__(other)

如果置信度大于或等于其他置信度,则返回True。

__add__(other)

将两个置信度对象的值相加。

__radd__(other)

在两个置信度对象的值之间进行反向相加。

__sub__(other)

对两个置信度对象的值进行减法。

__rsub__(other)

在两个置信度对象的值之间进行反向减法。

__mul__(other)

对两个置信度对象的值进行乘法运算。

__rmul__(other)

在两个置信度对象的值之间进行逆乘法。

__truediv__(other)

对两个置信度对象值进行除法运算。

__rtruediv__(other)

对两个置信度对象的值进行逆除法。

__floordiv__(other)

C式和老式的分工。

__rfloordiv__(other)

品行颠倒了C式和老式的分工。

__mod__(other)

两个置信度对象的值之间的传导模量。

__rmod__(other)

在两个置信度对象的值之间进行反向模数。

__divmod__(other)

返回商和余数,将置信值除以给定值。

__rdivmod__(other)

返回商和余数,将给定值除以置信值。

__pow__(other, modulo=None)

返回置信度对象提升到给定幂的值。

__rpow__(other)

返回给定值的置信度对象值的幂。

__neg__()

对信任对象进行否定。

__pos__()

返回置信度对象的值。

__abs__()

返回置信度对象的绝对值。

__float__()

返回置信度对象的浮点值。

__int__()

返回置信度对象的整数值。

class Bio.Phylo.PhyloXML.Date(value=None, unit=None, desc=None, minimum=None, maximum=None)

基类:PhyloElement

与分支/节点关联的日期。

它的值可以是数值,方法是使用‘value’元素和/或带有‘desc’元素的自由文本(例如“志留纪”)。如果使用数值,建议使用“unit”属性。

参数:
单位字符串

数值类型(例如‘百万年前’的‘mya’)

价值浮动

日期值

说明字符串

日期的纯文本描述

最低要求浮动

日期值的下限

最大值浮动

日期值的上限

__init__(value=None, unit=None, desc=None, minimum=None, maximum=None)

初始化Date对象的值。

__str__()

显示类名和人类可读的日期。

class Bio.Phylo.PhyloXML.Distribution(desc=None, points=None, polygons=None)

基类:PhyloElement

分支项目(物种、序列)的地理分布。

适用于系统地理应用。

参数:
说明字符串

位置的自由文本描述

点:列表 Point 对象列表:

坐标(类似于Google的KML格式中的‘Point’元素)

多边形:列表 Polygon 对象列表:

定义地理区域的坐标集

__init__(desc=None, points=None, polygons=None)

初始化分发对象的值。

class Bio.Phylo.PhyloXML.DomainArchitecture(length=None, domains=None)

基类:PhyloElement

蛋白质的结构域。

参数:
长度集成

蛋白质序列的总长度

列出ProteinDomain对象

该蛋白质中的结构域

__init__(length=None, domains=None)

初始化DomainArchitecture对象的值。

class Bio.Phylo.PhyloXML.Events(type=None, duplications=None, speciations=None, losses=None, confidence=None)

基类:PhyloElement

分支根节的事件(例如,一个基因复制)。

默认情况下,所有属性都设置为None,但也可以将此对象视为字典,在这种情况下,None值将被视为缺少的键,删除键会将该属性的值重置回None。

ok_type = {'fusion', 'mixed', 'other', 'speciation_or_duplication', 'transfer', 'unassigned'}
__init__(type=None, duplications=None, speciations=None, losses=None, confidence=None)

初始化Events对象的值。

items()

返回事件的项。

keys()

返回事件的键。

values()

从事件字典中的键-值对返回值。

__len__()

返回事件数。

__getitem__(key)

使用给定的键获取事件的值。

__setitem__(key, val)

将项目添加到事件字典。

__delitem__(key)

删除具有给定密钥的事件。

__iter__()

迭代事件字典中出现的键。

__contains__(key)

如果事件判定包含键,则返回True。

class Bio.Phylo.PhyloXML.Id(value, provider=None)

基类:PhyloElement

通用标识符元素。

允许指示标识符的提供者(或权威机构),例如NCBI,以及值本身。

__init__(value, provider=None)

初始化标识符对象的值。

__str__()

以字符串形式返回标识符。

class Bio.Phylo.PhyloXML.MolSeq(value, is_aligned=None)

基类:PhyloElement

存储分子序列。

参数:
价值字符串

序列本身

is_aligned布尔尔

如果此序列与其他序列对齐,则为True(通常表示所有对齐的序列长度相同,可能存在间隙)

re_value = re.compile('[a-zA-Z\\.\\-\\?\\*_]+')
__init__(value, is_aligned=None)

初始化MolSeq对象的参数。

__str__()

返回分子序列对象的值。

class Bio.Phylo.PhyloXML.Point(geodetic_datum, lat, long, alt=None, alt_unit=None)

基类:PhyloElement

点的地理坐标,具有可选的高度。

由元素“分发”使用。

参数:
geodetic_datum字符串,必填

大地基准面(也称为地图基准面)。例如,谷歌的KML使用“WGS84”。

稍后数字

纬度

数字

经度

替代数字

海拔高度

alt_unit字符串

高度单位(例如‘米’)

__init__(geodetic_datum, lat, long, alt=None, alt_unit=None)

初始化点对象的值。

class Bio.Phylo.PhyloXML.Polygon(points=None)

基类:PhyloElement

由“点”列表定义的多边形(由元素“分布”使用)。

参数:

points -- 表示顶点的3个或更多点的列表。

__init__(points=None)

初始化多边形对象的值。

__str__()

以字符串形式返回点列表。

class Bio.Phylo.PhyloXML.Property(value, ref, applies_to, datatype, unit=None, id_ref=None)

基类:PhyloElement

来自外部资源的类型化和引用的属性。

可以附加到 PhylogenyClade ,以及 Annotation 对象。

参数:
价值字符串

属性的值

参考字符串

对外部资源的引用,例如“美国国家海洋和大气局:深度”

applies_to字符串

指示属性应用到的项(例如,“node”表示分支的父节点,“parent_Branch”表示分支的父分支,或仅“clade”)。

数据类型字符串

属性的类型;限制为xsd-datatypes(例如,‘xsd:string’、‘xsd:boolean’、‘xsd:Integer’、‘xsd:decimal’、‘xsd:Float’、‘xsd:Double’、‘xsd:date’、‘xsd:anyURI’)。

单位字符串(可选)

财产的单位,例如“公制:M”

id_refID(可选)

允许将属性专门附加到一个元素(在XML级别)

re_ref = re.compile('[a-zA-Z0-9_]+:[a-zA-Z0-9_\\.\\-\\s]+')
ok_applies_to = {'annotation', 'clade', 'node', 'other', 'parent_branch', 'phylogeny'}
ok_datatype = {'xsd:anyURI', 'xsd:base64Binary', 'xsd:boolean', 'xsd:byte', 'xsd:date', 'xsd:dateTime', 'xsd:decimal', 'xsd:double', 'xsd:duration', 'xsd:float', 'xsd:gDay', 'xsd:gMonth', 'xsd:gMonthDay', 'xsd:gYear', 'xsd:gYearMonth', 'xsd:hexBinary', 'xsd:int', 'xsd:integer', 'xsd:long', 'xsd:negativeInteger', 'xsd:nonNegativeInteger', 'xsd:nonPositiveInteger', 'xsd:normalizedString', 'xsd:positiveInteger', 'xsd:short', 'xsd:string', 'xsd:time', 'xsd:token', 'xsd:unsignedByte', 'xsd:unsignedInt', 'xsd:unsignedLong', 'xsd:unsignedShort'}
__init__(value, ref, applies_to, datatype, unit=None, id_ref=None)

初始化Property对象的值。

class Bio.Phylo.PhyloXML.ProteinDomain(value, start, end, confidence=None, id=None)

基类:PhyloElement

表示域体系结构中的单个域。

与包括SeqFeature在内的大多数Python对象一样,位置使用从0开始的索引,而不是通常从1开始的生物约定。这意味着可以直接将start和end属性用作Seq对象的切片索引。

参数:
开始非负整数

序列上的域的开始,使用从0开始的索引

结束非负整数

序列上结构域的结尾

信心浮动

可用于存储例如E值

ID号字符串

唯一标识符/名称

__init__(value, start, end, confidence=None, id=None)

初始化ProteinDomain对象的值。

classmethod from_seqfeature(feat)

从SeqFeature创建ProteinDomain对象。

to_seqfeature()

从ProteinDomain对象创建SeqFeature。

class Bio.Phylo.PhyloXML.Reference(doi=None, desc=None)

基类:PhyloElement

一个分支的文献参考。

注:只要有可能,请使用 doi 属性而不是自由文本 desc 元素。

re_doi = re.compile('[a-zA-Z0-9_\\.]+/[a-zA-Z0-9_\\.]+')
__init__(doi=None, desc=None)

初始化引用类对象的元素。

class Bio.Phylo.PhyloXML.Sequence(type=None, id_ref=None, id_source=None, symbol=None, accession=None, name=None, location=None, mol_seq=None, uri=None, domain_architecture=None, annotations=None, other=None)

基类:PhyloElement

与节点相关的分子序列(蛋白质、DNA、RNA)。

一个预定的用途是 id_ref 是将序列链接到分类法(通过分类法的 id_source )在每个节点有多个序列和分类的情况下。

参数:
类型{‘DNA’,‘RNA’,‘蛋白质’}

此序列代表的分子类型

id_ref字符串

对另一资源的引用

id_source字符串

参考资料的来源

符号字符串

序列的简短符号,例如‘ACTM’(最大10个字符)

加入加入

此序列的登录码。

名字字符串

序列的全名,例如‘肌肉肌动蛋白’

位置

序列在基因组/染色体上的位置。

mol_seqMolSeq

分子序列本身

URIURI

链接

注释注释对象列表

关于此序列的注释

domain_architectureDomainArchitecture

该序列上的蛋白质结构域

其他其他对象列表

非phyloXML元素

types = {'dna', 'protein', 'rna'}
re_symbol = re.compile('\\S{1,10}')
__init__(type=None, id_ref=None, id_source=None, symbol=None, accession=None, name=None, location=None, mol_seq=None, uri=None, domain_architecture=None, annotations=None, other=None)

初始化序列对象的值。

classmethod from_seqrecord(record, is_aligned=None)

从SeqRecord对象创建新的PhyloXML序列。

to_seqrecord()

从此序列实例创建SeqRecord对象。

seqrecord.Annotation字典的打包方式如下::

{ # Sequence attributes with no SeqRecord equivalent:
  'id_ref': self.id_ref,
  'id_source': self.id_source,
  'location': self.location,
  'uri': { 'value': self.uri.value,
                  'desc': self.uri.desc,
                  'type': self.uri.type },
  # Sequence.annotations attribute (list of Annotations)
  'annotations': [{'ref': ann.ref,
                   'source': ann.source,
                   'evidence': ann.evidence,
                   'type': ann.type,
                   'confidence': [ann.confidence.value,
                                  ann.confidence.type],
                   'properties': [{'value': prop.value,
                                    'ref': prop.ref,
                                    'applies_to': prop.applies_to,
                                    'datatype': prop.datatype,
                                    'unit': prop.unit,
                                    'id_ref': prop.id_ref}
                                   for prop in ann.properties],
                  } for ann in self.annotations],
}
class Bio.Phylo.PhyloXML.SequenceRelation(type, id_ref_0, id_ref_1, distance=None, confidence=None)

基类:PhyloElement

表示两个序列之间的类型化关系。

例如,这可以用于描述正字法(在这种情况下,属性“type”是“Orthology”)。

参数:
id_ref_0ID号

第一序列参考标识符

id_ref_1ID号

第二序列参考标识符

距离浮动

两个序列之间的距离

类型受限字符串

描述关系类型

信心信心

此关系的置信度

ok_type = {'one_to_one_orthology', 'orthology', 'other', 'paralogy', 'super_orthology', 'ultra_paralogy', 'unknown', 'xenology'}
__init__(type, id_ref_0, id_ref_1, distance=None, confidence=None)

初始化类。

class Bio.Phylo.PhyloXML.Taxonomy(id_source=None, id=None, code=None, scientific_name=None, authority=None, rank=None, uri=None, common_names=None, synonyms=None, other=None)

基类:PhyloElement

描述分支的分类信息。

参数:
id_sourceID号

将其他元素链接到分类法(在XML级别)

ID号ID号

分类单元的唯一标识符,例如,加州海兔的ID(‘6500’,Provider=‘NCBI_TATIONY’)

代码受限字符串

存储UniProt/Swiss-Prot样式的有机体代码,例如加州海兔‘Aplysia calfornica’的‘APLCA’

scientific_name字符串

这种生物的标准学名,例如加州海兔的“Aplysia calfornica”

权威机构字符串

保持权威,如‘J.G.Cooper,1863’,与‘Science_name’相关联

common_names字符串列表

这种有机体的通用名称

同义词字符串列表

这个分类单元的同义词是什么?

排名受限字符串

分类等级

URIURI

链接

其他其他对象列表

非phyloXML元素

re_code = re.compile('[a-zA-Z0-9_]{2,10}')
ok_rank = {'branch', 'class', 'cohort', 'cultivar', 'division', 'domain', 'family', 'form', 'genus', 'infraclass', 'infracohort', 'infradivision', 'infrakingdom', 'infralegion', 'infraphylum', 'infratribe', 'kingdom', 'legion', 'microphylum', 'order', 'other', 'phylum', 'species', 'subclass', 'subcohort', 'subdivision', 'subfamily', 'subform', 'subgenus', 'subkingdom', 'sublegion', 'suborder', 'subphylum', 'subspecies', 'subtribe', 'subvariety', 'superclass', 'supercohort', 'superdivision', 'superfamily', 'superlegion', 'superorder', 'superphylum', 'superspecies', 'supertribe', 'tribe', 'unknown', 'variety'}
__init__(id_source=None, id=None, code=None, scientific_name=None, authority=None, rank=None, uri=None, common_names=None, synonyms=None, other=None)

初始化类。

__str__()

显示类名和标识属性。

class Bio.Phylo.PhyloXML.Uri(value, desc=None, type=None)

基类:PhyloElement

统一资源标识符。

通常,这应该是一个URL(例如,链接到网站上的图像,在这种情况下 type 属性可以是“image”,并且 desc 可能是“加州海兔的形象”)。

__init__(value, desc=None, type=None)

初始化类。

__str__()

返回URI的字符串表示形式。