Bio.Phylo.PhyloXML模块¶

与phyloXML元素对应的类。

另请参阅¶

官方规格：: http://phyloxml.org/
期刊文章：: 韩和兹马塞克(2009年)，https://doi.org/10.1186/1471-2105-10-356

exception Bio.Phylo.PhyloXML.PhyloXMLWarning¶

基类：BiopythonWarning

不符合phyloXML规范的警告。

class Bio.Phylo.PhyloXML.PhyloElement¶

基类：TreeElement

所有PhyloXML对象的基类。

class Bio.Phylo.PhyloXML.Phyloxml(attributes, phylogenies=None, other=None)¶

基类：PhyloElement

PhyloXML文档的根节点。

包含任意数量的发展史元素，后跟可能是来自其他命名空间的元素。

参数:

属性DICT: (XML命名空间定义)
系统发育学列表: 系统发育树
其他列表: 任意非phyloXML元素(如果有的话)

__init__(attributes, phylogenies=None, other=None)¶: 初始化PhyloXML对象的参数。

__getitem__(index)¶: 通过索引或名称获得系统发展史。

__iter__()¶: 遍历此对象中的系统发生树。

__len__()¶: 返回此对象中的系统发育树数。

__str__()¶: 返回对象中系统发展史的名称。

class Bio.Phylo.PhyloXML.Other(tag, namespace=None, attributes=None, value=None, children=None)¶

基类：PhyloElement

树中非phyloXML元素的容器。

通常，另一个对象将具有“value”或非空的“Children”列表，但不能同时具有这两个列表。不过，这在这里没有强制执行。

参数:

标签字符串: XML节点的本地标记
命名空间字符串: 节点的XML命名空间--不应该是默认的phyloXML命名空间。
属性字符串词典: XML节点上的属性
价值字符串: 直接包含在此XML节点中的文本
儿童列表: 子节点(如果有的话)(也 Other 实例)

__init__(tag, namespace=None, attributes=None, value=None, children=None)¶: 初始化非phyloXML元素的值。

__iter__()¶: 循环访问此对象的子级(如果有的话)。

class Bio.Phylo.PhyloXML.Phylogeny(root=None, rooted=True, rerootable=None, branch_length_unit=None, type=None, name=None, id=None, description=None, date=None, confidences=None, clade_relations=None, sequence_relations=None, properties=None, other=None)¶

基类：PhyloElement, Tree

一个系统发育树。

参数:

根部分支: 此树的根节点/分支
扎根布尔尔: 如果此树是根树，则为True
可重新旋转的布尔尔: 如果此树是可重写的，则为True
branch_length_unit字符串: 分支上的BRANCH_LENGTH值的单位
名字字符串: 此树的标识符，不要求唯一
ID号ID号: 此树的唯一标识符
描述字符串: 纯文本描述
日期日期: 此树的根节点的日期
信任列表: 此树的信任对象
clade_relations列表: CladeRelation对象
sequence_relations列表: SequenceRelation对象
属性列表: 属性对象
其他列表: 非phyloXML元素(类型 Other )

__init__(root=None, rooted=True, rerootable=None, branch_length_unit=None, type=None, name=None, id=None, description=None, date=None, confidences=None, clade_relations=None, sequence_relations=None, properties=None, other=None)¶: 初始化系统发育树对象的值。

classmethod from_tree(tree, **kwargs)¶

根据一棵树(从Newick/Nexus或BaseTree)创建新的系统发育图。

关键字参数是常见的 Phylogeny 构造函数参数。

classmethod from_clade(clade, **kwargs)¶

在给定Newick或BaseTree Clade对象的情况下创建新的系统发展史。

关键字参数是常见的 PhyloXML.Clade 构造函数参数。

as_phyloxml()¶

返回此树，这是一个与PhyloXML兼容的系统发展史对象。

重写 BaseTree 方法。

to_phyloxml_container(**kwargs)¶: 创建一个仅包含此系统发展史的新Phyloxml对象。

to_alignment()¶: 根据此树中的比对序列构建比对。

property confidence¶

相当于自信 [0] 如果只有1个值(私有)。

另请参阅： Clade.confidence ， Clade.taxonomy

class Bio.Phylo.PhyloXML.Clade(branch_length=None, id_source=None, name=None, width=None, color=None, node_id=None, events=None, binary_characters=None, date=None, confidences=None, taxonomies=None, sequences=None, distributions=None, references=None, properties=None, clades=None, other=None)¶

基类：PhyloElement, Clade

描述当前系统发育树的一个分支。

递归使用，描述系统发育树的拓扑。

两者都有 color 和 width 元素应由客户端代码解释为应用于整个分支，包括所有后代，除非在子分支中被覆盖。此模块不会自动将这些属性分配给子分支来实现此级联--您也不应该这样做。

参数:

branch_length: 此分支的父分支长度
id_source: 将其他元素链接到一个分支(在XML级别)
名字字符串: 此分支的短标签
信任置信度对象列表: 用于指示对分支/父分支的支持。
宽度浮动: 此分支的分支宽度(包括来自父级的分支)
颜色BranchColor: 用于此分支的图形显示的颜色
node_id: 此分支的根节点的唯一标识符
分类学列表: 分类对象
序列列表: 序列对象
活动活动: 描述该分支的根节点/父分支上的基因复制等事件
binary_charactersBinaryCharacters: 二进制字符
分配分发对象列表: 此分支的分布情况
日期日期: 此分支的根节点的日期
参考文献列表: 参考对象
属性列表: 属性对象
分支列出Clade对象: 子分支
其他其他对象列表: 非phyloXML对象

__init__(branch_length=None, id_source=None, name=None, width=None, color=None, node_id=None, events=None, binary_characters=None, date=None, confidences=None, taxonomies=None, sequences=None, distributions=None, references=None, properties=None, clades=None, other=None)¶: 初始化Clade对象的值。

classmethod from_clade(clade, **kwargs)¶

从Newick或BaseTree Clade对象创建新的PhyloXML Clade。

关键字参数是常用的PhyloXML Clade构造函数参数。

to_phylogeny(**kwargs)¶: 创建一个只包含这个支系的新的系统发展史。

property confidence¶: 返回置信度值(私有)。

property taxonomy¶: 获取该分支的分类列表(私有)。

class Bio.Phylo.PhyloXML.BranchColor(*args, **kwargs)¶

基类：PhyloElement, BranchColor

管理树枝的颜色。

__init__(*args, **kwargs)¶: 初始化BranchColor对象的参数。

class Bio.Phylo.PhyloXML.Accession(value, source)¶

基类：PhyloElement

捕获序列标识符中的本地部分。

示例：In UniProtKB:P17304 ，Accession实例属性 value 是‘P17304’，并且 source 属性为“UniProtKB”。

__init__(value, source)¶: 初始化访问对象的值。

__str__()¶: 显示类名和标识属性。

class Bio.Phylo.PhyloXML.Annotation(ref=None, source=None, evidence=None, type=None, desc=None, confidence=None, uri=None, properties=None)¶

基类：PhyloElement

分子序列的注释。

建议使用可选的“ref”属性进行批注。

参数:

参考字符串: 参考字符串，例如“GO：0008270”，“KEGG：四氯乙烯降解”，“EC：1.1.1.1”
来源字符串: 此批注的纯文本源
证据应力: 将证据描述为自由文本(例如，“实验性”)
说明字符串: 自由文本说明
信心信心: 说明支持的类型和值(类型置信度)
属性列表: 来自外部资源的类型化和引用的批注
URIURI: 链接

re_ref = re.compile('[a-zA-Z0-9_]+:[a-zA-Z0-9_\\.\\-\\s]+')¶

__init__(ref=None, source=None, evidence=None, type=None, desc=None, confidence=None, uri=None, properties=None)¶: 初始化Annotation对象的值。

class Bio.Phylo.PhyloXML.BinaryCharacters(type=None, gained_count=None, lost_count=None, present_count=None, absent_count=None, gained=None, lost=None, present=None, absent=None)¶

基类：PhyloElement

分支根部的二进制字符。

在分支的根部存在、获得和丢失的二进制字符的名称和/或计数。

__init__(type=None, gained_count=None, lost_count=None, present_count=None, absent_count=None, gained=None, lost=None, present=None, absent=None)¶: 初始化BinaryCharacters对象的值。

class Bio.Phylo.PhyloXML.CladeRelation(type, id_ref_0, id_ref_1, distance=None, confidence=None)¶

基类：PhyloElement

表示两个分支之间的类型化关系。

例如，这可用于描述一个分支的多个父级。

__init__(type, id_ref_0, id_ref_1, distance=None, confidence=None)¶: 初始化CladeRelation对象的值。

class Bio.Phylo.PhyloXML.Confidence(value, type='unknown')¶

基类：PhyloElement

一种通用的信任元素。

例如，这可用于表示分支的引导支持值(在这种情况下 type 属性为“bootstrap”)。

参数:

价值浮动: 置信度值
类型字符串: 置信度类型的标签，例如‘Bootstrap’

__init__(value, type='unknown')¶: 初始化置信度对象的值。

__hash__()¶

返回对象的哈希值。

哈希值是整数。它们用于在字典查找期间快速比较字典键。比较相等的数值具有相同的散列值(即使它们的类型不同，如1和1.0的情况)。

__eq__(other)¶: 检查置信度对象之间是否相等。

__ne__(other)¶: 检查两个置信度对象之间的不等性。

__lt__(other)¶: 如果置信度小于其他置信度，则返回True。

__le__(other)¶: 如果置信度小于或等于其他置信度，则返回True。

__gt__(other)¶: 如果信心大于其他信心，则返回True。

__ge__(other)¶: 如果置信度大于或等于其他置信度，则返回True。

__add__(other)¶: 将两个置信度对象的值相加。

__radd__(other)¶: 在两个置信度对象的值之间进行反向相加。

__sub__(other)¶: 对两个置信度对象的值进行减法。

__rsub__(other)¶: 在两个置信度对象的值之间进行反向减法。

__mul__(other)¶: 对两个置信度对象的值进行乘法运算。

__rmul__(other)¶: 在两个置信度对象的值之间进行逆乘法。

__truediv__(other)¶: 对两个置信度对象值进行除法运算。

__rtruediv__(other)¶: 对两个置信度对象的值进行逆除法。

__floordiv__(other)¶: C式和老式的分工。

__rfloordiv__(other)¶: 品行颠倒了C式和老式的分工。

__mod__(other)¶: 两个置信度对象的值之间的传导模量。

__rmod__(other)¶: 在两个置信度对象的值之间进行反向模数。

__divmod__(other)¶: 返回商和余数，将置信值除以给定值。

__rdivmod__(other)¶: 返回商和余数，将给定值除以置信值。

__pow__(other, modulo=None)¶: 返回置信度对象提升到给定幂的值。

__rpow__(other)¶: 返回给定值的置信度对象值的幂。

__neg__()¶: 对信任对象进行否定。

__pos__()¶: 返回置信度对象的值。

__abs__()¶: 返回置信度对象的绝对值。

__float__()¶: 返回置信度对象的浮点值。

__int__()¶: 返回置信度对象的整数值。

class Bio.Phylo.PhyloXML.Date(value=None, unit=None, desc=None, minimum=None, maximum=None)¶

基类：PhyloElement

与分支/节点关联的日期。

它的值可以是数值，方法是使用‘value’元素和/或带有‘desc’元素的自由文本(例如“志留纪”)。如果使用数值，建议使用“unit”属性。

参数:

单位字符串: 数值类型(例如‘百万年前’的‘mya’)
价值浮动: 日期值
说明字符串: 日期的纯文本描述
最低要求浮动: 日期值的下限
最大值浮动: 日期值的上限

__init__(value=None, unit=None, desc=None, minimum=None, maximum=None)¶: 初始化Date对象的值。

__str__()¶: 显示类名和人类可读的日期。

class Bio.Phylo.PhyloXML.Distribution(desc=None, points=None, polygons=None)¶

基类：PhyloElement

分支项目(物种、序列)的地理分布。

适用于系统地理应用。

参数:

说明字符串: 位置的自由文本描述
点：列表 Point 对象列表：: 坐标(类似于Google的KML格式中的‘Point’元素)
多边形：列表 Polygon 对象列表：: 定义地理区域的坐标集

__init__(desc=None, points=None, polygons=None)¶: 初始化分发对象的值。

class Bio.Phylo.PhyloXML.DomainArchitecture(length=None, domains=None)¶

基类：PhyloElement

蛋白质的结构域。

参数:

长度集成: 蛋白质序列的总长度
域列出ProteinDomain对象: 该蛋白质中的结构域

__init__(length=None, domains=None)¶: 初始化DomainArchitecture对象的值。

class Bio.Phylo.PhyloXML.Events(type=None, duplications=None, speciations=None, losses=None, confidence=None)¶

基类：PhyloElement

分支根节的事件(例如，一个基因复制)。

默认情况下，所有属性都设置为None，但也可以将此对象视为字典，在这种情况下，None值将被视为缺少的键，删除键会将该属性的值重置回None。

ok_type = {'fusion', 'mixed', 'other', 'speciation_or_duplication', 'transfer', 'unassigned'}¶

__init__(type=None, duplications=None, speciations=None, losses=None, confidence=None)¶: 初始化Events对象的值。

items()¶: 返回事件的项。

keys()¶: 返回事件的键。

values()¶: 从事件字典中的键-值对返回值。

__len__()¶: 返回事件数。

__getitem__(key)¶: 使用给定的键获取事件的值。

__setitem__(key, val)¶: 将项目添加到事件字典。

__delitem__(key)¶: 删除具有给定密钥的事件。

__iter__()¶: 迭代事件字典中出现的键。

__contains__(key)¶: 如果事件判定包含键，则返回True。

class Bio.Phylo.PhyloXML.Id(value, provider=None)¶

基类：PhyloElement

通用标识符元素。

允许指示标识符的提供者(或权威机构)，例如NCBI，以及值本身。

__init__(value, provider=None)¶: 初始化标识符对象的值。

__str__()¶: 以字符串形式返回标识符。

class Bio.Phylo.PhyloXML.MolSeq(value, is_aligned=None)¶

基类：PhyloElement

存储分子序列。

参数:

价值字符串: 序列本身
is_aligned布尔尔: 如果此序列与其他序列对齐，则为True(通常表示所有对齐的序列长度相同，可能存在间隙)

re_value = re.compile('[a-zA-Z\\.\\-\\?\\*_]+')¶

__init__(value, is_aligned=None)¶: 初始化MolSeq对象的参数。

__str__()¶: 返回分子序列对象的值。

class Bio.Phylo.PhyloXML.Point(geodetic_datum, lat, long, alt=None, alt_unit=None)¶

基类：PhyloElement

点的地理坐标，具有可选的高度。

由元素“分发”使用。

参数:

geodetic_datum字符串，必填: 大地基准面(也称为地图基准面)。例如，谷歌的KML使用“WGS84”。
稍后数字: 纬度
长数字: 经度
替代数字: 海拔高度
alt_unit字符串: 高度单位(例如‘米’)

__init__(geodetic_datum, lat, long, alt=None, alt_unit=None)¶: 初始化点对象的值。

class Bio.Phylo.PhyloXML.Polygon(points=None)¶

基类：PhyloElement

由“点”列表定义的多边形(由元素“分布”使用)。

参数:: points -- 表示顶点的3个或更多点的列表。

__init__(points=None)¶: 初始化多边形对象的值。

__str__()¶: 以字符串形式返回点列表。

class Bio.Phylo.PhyloXML.Property(value, ref, applies_to, datatype, unit=None, id_ref=None)¶

基类：PhyloElement

来自外部资源的类型化和引用的属性。

可以附加到 Phylogeny ， Clade ，以及 Annotation 对象。

参数:

价值字符串: 属性的值
参考字符串: 对外部资源的引用，例如“美国国家海洋和大气局：深度”
applies_to字符串: 指示属性应用到的项(例如，“node”表示分支的父节点，“parent_Branch”表示分支的父分支，或仅“clade”)。
数据类型字符串: 属性的类型；限制为xsd-datatypes(例如，‘xsd：string’、‘xsd：boolean’、‘xsd：Integer’、‘xsd：decimal’、‘xsd：Float’、‘xsd：Double’、‘xsd：date’、‘xsd：anyURI’)。
单位字符串(可选): 财产的单位，例如“公制：M”
id_refID(可选): 允许将属性专门附加到一个元素(在XML级别)

re_ref = re.compile('[a-zA-Z0-9_]+:[a-zA-Z0-9_\\.\\-\\s]+')¶

ok_applies_to = {'annotation', 'clade', 'node', 'other', 'parent_branch', 'phylogeny'}¶

ok_datatype = {'xsd:anyURI', 'xsd:base64Binary', 'xsd:boolean', 'xsd:byte', 'xsd:date', 'xsd:dateTime', 'xsd:decimal', 'xsd:double', 'xsd:duration', 'xsd:float', 'xsd:gDay', 'xsd:gMonth', 'xsd:gMonthDay', 'xsd:gYear', 'xsd:gYearMonth', 'xsd:hexBinary', 'xsd:int', 'xsd:integer', 'xsd:long', 'xsd:negativeInteger', 'xsd:nonNegativeInteger', 'xsd:nonPositiveInteger', 'xsd:normalizedString', 'xsd:positiveInteger', 'xsd:short', 'xsd:string', 'xsd:time', 'xsd:token', 'xsd:unsignedByte', 'xsd:unsignedInt', 'xsd:unsignedLong', 'xsd:unsignedShort'}¶

__init__(value, ref, applies_to, datatype, unit=None, id_ref=None)¶: 初始化Property对象的值。

class Bio.Phylo.PhyloXML.ProteinDomain(value, start, end, confidence=None, id=None)¶

基类：PhyloElement

表示域体系结构中的单个域。

与包括SeqFeature在内的大多数Python对象一样，位置使用从0开始的索引，而不是通常从1开始的生物约定。这意味着可以直接将start和end属性用作Seq对象的切片索引。

参数:

开始非负整数: 序列上的域的开始，使用从0开始的索引
结束非负整数: 序列上结构域的结尾
信心浮动: 可用于存储例如E值
ID号字符串: 唯一标识符/名称

__init__(value, start, end, confidence=None, id=None)¶: 初始化ProteinDomain对象的值。

classmethod from_seqfeature(feat)¶: 从SeqFeature创建ProteinDomain对象。

to_seqfeature()¶: 从ProteinDomain对象创建SeqFeature。

class Bio.Phylo.PhyloXML.Reference(doi=None, desc=None)¶

基类：PhyloElement

一个分支的文献参考。

注：只要有可能，请使用 doi 属性而不是自由文本 desc 元素。

re_doi = re.compile('[a-zA-Z0-9_\\.]+/[a-zA-Z0-9_\\.]+')¶

__init__(doi=None, desc=None)¶: 初始化引用类对象的元素。

class Bio.Phylo.PhyloXML.Sequence(type=None, id_ref=None, id_source=None, symbol=None, accession=None, name=None, location=None, mol_seq=None, uri=None, domain_architecture=None, annotations=None, other=None)¶

基类：PhyloElement

与节点相关的分子序列(蛋白质、DNA、RNA)。

一个预定的用途是 id_ref 是将序列链接到分类法(通过分类法的 id_source )在每个节点有多个序列和分类的情况下。

参数:

类型{‘DNA’，‘RNA’，‘蛋白质’}: 此序列代表的分子类型
id_ref字符串: 对另一资源的引用
id_source字符串: 参考资料的来源
符号字符串: 序列的简短符号，例如‘ACTM’(最大10个字符)
加入加入: 此序列的登录码。
名字字符串: 序列的全名，例如‘肌肉肌动蛋白’
位置: 序列在基因组/染色体上的位置。
mol_seqMolSeq: 分子序列本身
URIURI: 链接
注释注释对象列表: 关于此序列的注释
domain_architectureDomainArchitecture: 该序列上的蛋白质结构域
其他其他对象列表: 非phyloXML元素

types = {'dna', 'protein', 'rna'}¶

re_symbol = re.compile('\\S{1,10}')¶

__init__(type=None, id_ref=None, id_source=None, symbol=None, accession=None, name=None, location=None, mol_seq=None, uri=None, domain_architecture=None, annotations=None, other=None)¶: 初始化序列对象的值。

classmethod from_seqrecord(record, is_aligned=None)¶: 从SeqRecord对象创建新的PhyloXML序列。

to_seqrecord()¶

从此序列实例创建SeqRecord对象。

seqrecord.Annotation字典的打包方式如下：：

{ # Sequence attributes with no SeqRecord equivalent:
  'id_ref': self.id_ref,
  'id_source': self.id_source,
  'location': self.location,
  'uri': { 'value': self.uri.value,
                  'desc': self.uri.desc,
                  'type': self.uri.type },
  # Sequence.annotations attribute (list of Annotations)
  'annotations': [{'ref': ann.ref,
                   'source': ann.source,
                   'evidence': ann.evidence,
                   'type': ann.type,
                   'confidence': [ann.confidence.value,
                                  ann.confidence.type],
                   'properties': [{'value': prop.value,
                                    'ref': prop.ref,
                                    'applies_to': prop.applies_to,
                                    'datatype': prop.datatype,
                                    'unit': prop.unit,
                                    'id_ref': prop.id_ref}
                                   for prop in ann.properties],
                  } for ann in self.annotations],
}

class Bio.Phylo.PhyloXML.SequenceRelation(type, id_ref_0, id_ref_1, distance=None, confidence=None)¶

基类：PhyloElement

表示两个序列之间的类型化关系。

例如，这可以用于描述正字法(在这种情况下，属性“type”是“Orthology”)。

参数:

id_ref_0ID号: 第一序列参考标识符
id_ref_1ID号: 第二序列参考标识符
距离浮动: 两个序列之间的距离
类型受限字符串: 描述关系类型
信心信心: 此关系的置信度

ok_type = {'one_to_one_orthology', 'orthology', 'other', 'paralogy', 'super_orthology', 'ultra_paralogy', 'unknown', 'xenology'}¶

__init__(type, id_ref_0, id_ref_1, distance=None, confidence=None)¶: 初始化类。

class Bio.Phylo.PhyloXML.Taxonomy(id_source=None, id=None, code=None, scientific_name=None, authority=None, rank=None, uri=None, common_names=None, synonyms=None, other=None)¶

基类：PhyloElement

描述分支的分类信息。

参数:

id_sourceID号: 将其他元素链接到分类法(在XML级别)
ID号ID号: 分类单元的唯一标识符，例如，加州海兔的ID(‘6500’，Provider=‘NCBI_TATIONY’)
代码受限字符串: 存储UniProt/Swiss-Prot样式的有机体代码，例如加州海兔‘Aplysia calfornica’的‘APLCA’
scientific_name字符串: 这种生物的标准学名，例如加州海兔的“Aplysia calfornica”
权威机构字符串: 保持权威，如‘J.G.Cooper，1863’，与‘Science_name’相关联
common_names字符串列表: 这种有机体的通用名称
同义词字符串列表: 这个分类单元的同义词是什么？
排名受限字符串: 分类等级
URIURI: 链接
其他其他对象列表: 非phyloXML元素

re_code = re.compile('[a-zA-Z0-9_]{2,10}')¶

ok_rank = {'branch', 'class', 'cohort', 'cultivar', 'division', 'domain', 'family', 'form', 'genus', 'infraclass', 'infracohort', 'infradivision', 'infrakingdom', 'infralegion', 'infraphylum', 'infratribe', 'kingdom', 'legion', 'microphylum', 'order', 'other', 'phylum', 'species', 'subclass', 'subcohort', 'subdivision', 'subfamily', 'subform', 'subgenus', 'subkingdom', 'sublegion', 'suborder', 'subphylum', 'subspecies', 'subtribe', 'subvariety', 'superclass', 'supercohort', 'superdivision', 'superfamily', 'superlegion', 'superorder', 'superphylum', 'superspecies', 'supertribe', 'tribe', 'unknown', 'variety'}¶

__init__(id_source=None, id=None, code=None, scientific_name=None, authority=None, rank=None, uri=None, common_names=None, synonyms=None, other=None)¶: 初始化类。

__str__()¶: 显示类名和标识属性。

class Bio.Phylo.PhyloXML.Uri(value, desc=None, type=None)¶

基类：PhyloElement

统一资源标识符。

通常，这应该是一个URL(例如，链接到网站上的图像，在这种情况下 type 属性可以是“image”，并且 desc 可能是“加州海兔的形象”)。

__init__(value, desc=None, type=None)¶: 初始化类。

__str__()¶: 返回URI的字符串表示形式。