Bio.Phylo.PhyloXML模块¶
与phyloXML元素对应的类。
另请参阅¶
- 官方规格:
- 期刊文章:
韩和兹马塞克(2009年),https://doi.org/10.1186/1471-2105-10-356
- exception Bio.Phylo.PhyloXML.PhyloXMLWarning¶
-
不符合phyloXML规范的警告。
- class Bio.Phylo.PhyloXML.PhyloElement¶
基类:
TreeElement
所有PhyloXML对象的基类。
- class Bio.Phylo.PhyloXML.Phyloxml(attributes, phylogenies=None, other=None)¶
基类:
PhyloElement
PhyloXML文档的根节点。
包含任意数量的发展史元素,后跟可能是来自其他命名空间的元素。
- 参数:
- 属性DICT
(XML命名空间定义)
- 系统发育学列表
系统发育树
- 其他列表
任意非phyloXML元素(如果有的话)
- __init__(attributes, phylogenies=None, other=None)¶
初始化PhyloXML对象的参数。
- __getitem__(index)¶
通过索引或名称获得系统发展史。
- __iter__()¶
遍历此对象中的系统发生树。
- __len__()¶
返回此对象中的系统发育树数。
- __str__()¶
返回对象中系统发展史的名称。
- class Bio.Phylo.PhyloXML.Other(tag, namespace=None, attributes=None, value=None, children=None)¶
基类:
PhyloElement
树中非phyloXML元素的容器。
通常,另一个对象将具有“value”或非空的“Children”列表,但不能同时具有这两个列表。不过,这在这里没有强制执行。
- 参数:
- 标签字符串
XML节点的本地标记
- 命名空间字符串
节点的XML命名空间--不应该是默认的phyloXML命名空间。
- 属性字符串词典
XML节点上的属性
- 价值字符串
直接包含在此XML节点中的文本
- 儿童列表
子节点(如果有的话)(也
Other
实例)
- __init__(tag, namespace=None, attributes=None, value=None, children=None)¶
初始化非phyloXML元素的值。
- __iter__()¶
循环访问此对象的子级(如果有的话)。
- class Bio.Phylo.PhyloXML.Phylogeny(root=None, rooted=True, rerootable=None, branch_length_unit=None, type=None, name=None, id=None, description=None, date=None, confidences=None, clade_relations=None, sequence_relations=None, properties=None, other=None)¶
基类:
PhyloElement
,Tree
一个系统发育树。
- 参数:
- 根部分支
此树的根节点/分支
- 扎根布尔尔
如果此树是根树,则为True
- 可重新旋转的布尔尔
如果此树是可重写的,则为True
- branch_length_unit字符串
分支上的BRANCH_LENGTH值的单位
- 名字字符串
此树的标识符,不要求唯一
- ID号ID号
此树的唯一标识符
- 描述字符串
纯文本描述
- 日期日期
此树的根节点的日期
- 信任列表
此树的信任对象
- clade_relations列表
CladeRelation对象
- sequence_relations列表
SequenceRelation对象
- 属性列表
属性对象
- 其他列表
非phyloXML元素(类型
Other
)
- __init__(root=None, rooted=True, rerootable=None, branch_length_unit=None, type=None, name=None, id=None, description=None, date=None, confidences=None, clade_relations=None, sequence_relations=None, properties=None, other=None)¶
初始化系统发育树对象的值。
- classmethod from_tree(tree, **kwargs)¶
根据一棵树(从Newick/Nexus或BaseTree)创建新的系统发育图。
关键字参数是常见的
Phylogeny
构造函数参数。
- classmethod from_clade(clade, **kwargs)¶
在给定Newick或BaseTree Clade对象的情况下创建新的系统发展史。
关键字参数是常见的
PhyloXML.Clade
构造函数参数。
- as_phyloxml()¶
返回此树,这是一个与PhyloXML兼容的系统发展史对象。
重写
BaseTree
方法。
- to_phyloxml_container(**kwargs)¶
创建一个仅包含此系统发展史的新Phyloxml对象。
- to_alignment()¶
根据此树中的比对序列构建比对。
- property confidence¶
相当于自信 [0] 如果只有1个值(私有)。
另请参阅:
Clade.confidence
,Clade.taxonomy
- class Bio.Phylo.PhyloXML.Clade(branch_length=None, id_source=None, name=None, width=None, color=None, node_id=None, events=None, binary_characters=None, date=None, confidences=None, taxonomies=None, sequences=None, distributions=None, references=None, properties=None, clades=None, other=None)¶
基类:
PhyloElement
,Clade
描述当前系统发育树的一个分支。
递归使用,描述系统发育树的拓扑。
两者都有
color
和width
元素应由客户端代码解释为应用于整个分支,包括所有后代,除非在子分支中被覆盖。此模块不会自动将这些属性分配给子分支来实现此级联--您也不应该这样做。- 参数:
- branch_length
此分支的父分支长度
- id_source
将其他元素链接到一个分支(在XML级别)
- 名字字符串
此分支的短标签
- 信任置信度对象列表
用于指示对分支/父分支的支持。
- 宽度浮动
此分支的分支宽度(包括来自父级的分支)
- 颜色BranchColor
用于此分支的图形显示的颜色
- node_id
此分支的根节点的唯一标识符
- 分类学列表
分类对象
- 序列列表
序列对象
- 活动活动
描述该分支的根节点/父分支上的基因复制等事件
- binary_charactersBinaryCharacters
二进制字符
- 分配分发对象列表
此分支的分布情况
- 日期日期
此分支的根节点的日期
- 参考文献列表
参考对象
- 属性列表
属性对象
- 分支列出Clade对象
子分支
- 其他其他对象列表
非phyloXML对象
- __init__(branch_length=None, id_source=None, name=None, width=None, color=None, node_id=None, events=None, binary_characters=None, date=None, confidences=None, taxonomies=None, sequences=None, distributions=None, references=None, properties=None, clades=None, other=None)¶
初始化Clade对象的值。
- classmethod from_clade(clade, **kwargs)¶
从Newick或BaseTree Clade对象创建新的PhyloXML Clade。
关键字参数是常用的PhyloXML Clade构造函数参数。
- to_phylogeny(**kwargs)¶
创建一个只包含这个支系的新的系统发展史。
- property confidence¶
返回置信度值(私有)。
- property taxonomy¶
获取该分支的分类列表(私有)。
- class Bio.Phylo.PhyloXML.BranchColor(*args, **kwargs)¶
-
管理树枝的颜色。
- __init__(*args, **kwargs)¶
初始化BranchColor对象的参数。
- class Bio.Phylo.PhyloXML.Accession(value, source)¶
基类:
PhyloElement
捕获序列标识符中的本地部分。
示例:In
UniProtKB:P17304
,Accession实例属性value
是‘P17304’,并且source
属性为“UniProtKB”。- __init__(value, source)¶
初始化访问对象的值。
- __str__()¶
显示类名和标识属性。
- class Bio.Phylo.PhyloXML.Annotation(ref=None, source=None, evidence=None, type=None, desc=None, confidence=None, uri=None, properties=None)¶
基类:
PhyloElement
分子序列的注释。
建议使用可选的“ref”属性进行批注。
- 参数:
- 参考字符串
参考字符串,例如“GO:0008270”,“KEGG:四氯乙烯降解”,“EC:1.1.1.1”
- 来源字符串
此批注的纯文本源
- 证据应力
将证据描述为自由文本(例如,“实验性”)
- 说明字符串
自由文本说明
- 信心信心
说明支持的类型和值(类型置信度)
- 属性列表
来自外部资源的类型化和引用的批注
- URIURI
链接
- re_ref = re.compile('[a-zA-Z0-9_]+:[a-zA-Z0-9_\\.\\-\\s]+')¶
- __init__(ref=None, source=None, evidence=None, type=None, desc=None, confidence=None, uri=None, properties=None)¶
初始化Annotation对象的值。
- class Bio.Phylo.PhyloXML.BinaryCharacters(type=None, gained_count=None, lost_count=None, present_count=None, absent_count=None, gained=None, lost=None, present=None, absent=None)¶
基类:
PhyloElement
分支根部的二进制字符。
在分支的根部存在、获得和丢失的二进制字符的名称和/或计数。
- __init__(type=None, gained_count=None, lost_count=None, present_count=None, absent_count=None, gained=None, lost=None, present=None, absent=None)¶
初始化BinaryCharacters对象的值。
- class Bio.Phylo.PhyloXML.CladeRelation(type, id_ref_0, id_ref_1, distance=None, confidence=None)¶
基类:
PhyloElement
表示两个分支之间的类型化关系。
例如,这可用于描述一个分支的多个父级。
- __init__(type, id_ref_0, id_ref_1, distance=None, confidence=None)¶
初始化CladeRelation对象的值。
- class Bio.Phylo.PhyloXML.Confidence(value, type='unknown')¶
基类:
PhyloElement
一种通用的信任元素。
例如,这可用于表示分支的引导支持值(在这种情况下
type
属性为“bootstrap”)。- 参数:
- 价值浮动
置信度值
- 类型字符串
置信度类型的标签,例如‘Bootstrap’
- __init__(value, type='unknown')¶
初始化置信度对象的值。
- __hash__()¶
返回对象的哈希值。
哈希值是整数。它们用于在字典查找期间快速比较字典键。比较相等的数值具有相同的散列值(即使它们的类型不同,如1和1.0的情况)。
- __eq__(other)¶
检查置信度对象之间是否相等。
- __ne__(other)¶
检查两个置信度对象之间的不等性。
- __lt__(other)¶
如果置信度小于其他置信度,则返回True。
- __le__(other)¶
如果置信度小于或等于其他置信度,则返回True。
- __gt__(other)¶
如果信心大于其他信心,则返回True。
- __ge__(other)¶
如果置信度大于或等于其他置信度,则返回True。
- __add__(other)¶
将两个置信度对象的值相加。
- __radd__(other)¶
在两个置信度对象的值之间进行反向相加。
- __sub__(other)¶
对两个置信度对象的值进行减法。
- __rsub__(other)¶
在两个置信度对象的值之间进行反向减法。
- __mul__(other)¶
对两个置信度对象的值进行乘法运算。
- __rmul__(other)¶
在两个置信度对象的值之间进行逆乘法。
- __truediv__(other)¶
对两个置信度对象值进行除法运算。
- __rtruediv__(other)¶
对两个置信度对象的值进行逆除法。
- __floordiv__(other)¶
C式和老式的分工。
- __rfloordiv__(other)¶
品行颠倒了C式和老式的分工。
- __mod__(other)¶
两个置信度对象的值之间的传导模量。
- __rmod__(other)¶
在两个置信度对象的值之间进行反向模数。
- __divmod__(other)¶
返回商和余数,将置信值除以给定值。
- __rdivmod__(other)¶
返回商和余数,将给定值除以置信值。
- __pow__(other, modulo=None)¶
返回置信度对象提升到给定幂的值。
- __rpow__(other)¶
返回给定值的置信度对象值的幂。
- __neg__()¶
对信任对象进行否定。
- __pos__()¶
返回置信度对象的值。
- __abs__()¶
返回置信度对象的绝对值。
- __float__()¶
返回置信度对象的浮点值。
- __int__()¶
返回置信度对象的整数值。
- class Bio.Phylo.PhyloXML.Date(value=None, unit=None, desc=None, minimum=None, maximum=None)¶
基类:
PhyloElement
与分支/节点关联的日期。
它的值可以是数值,方法是使用‘value’元素和/或带有‘desc’元素的自由文本(例如“志留纪”)。如果使用数值,建议使用“unit”属性。
- 参数:
- 单位字符串
数值类型(例如‘百万年前’的‘mya’)
- 价值浮动
日期值
- 说明字符串
日期的纯文本描述
- 最低要求浮动
日期值的下限
- 最大值浮动
日期值的上限
- __init__(value=None, unit=None, desc=None, minimum=None, maximum=None)¶
初始化Date对象的值。
- __str__()¶
显示类名和人类可读的日期。
- class Bio.Phylo.PhyloXML.Distribution(desc=None, points=None, polygons=None)¶
基类:
PhyloElement
分支项目(物种、序列)的地理分布。
适用于系统地理应用。
- 参数:
- 说明字符串
位置的自由文本描述
- 点:列表
Point
对象列表: 坐标(类似于Google的KML格式中的‘Point’元素)
- 多边形:列表
Polygon
对象列表: 定义地理区域的坐标集
- __init__(desc=None, points=None, polygons=None)¶
初始化分发对象的值。
- class Bio.Phylo.PhyloXML.DomainArchitecture(length=None, domains=None)¶
基类:
PhyloElement
蛋白质的结构域。
- 参数:
- 长度集成
蛋白质序列的总长度
- 域列出ProteinDomain对象
该蛋白质中的结构域
- __init__(length=None, domains=None)¶
初始化DomainArchitecture对象的值。
- class Bio.Phylo.PhyloXML.Events(type=None, duplications=None, speciations=None, losses=None, confidence=None)¶
基类:
PhyloElement
分支根节的事件(例如,一个基因复制)。
默认情况下,所有属性都设置为None,但也可以将此对象视为字典,在这种情况下,None值将被视为缺少的键,删除键会将该属性的值重置回None。
- ok_type = {'fusion', 'mixed', 'other', 'speciation_or_duplication', 'transfer', 'unassigned'}¶
- __init__(type=None, duplications=None, speciations=None, losses=None, confidence=None)¶
初始化Events对象的值。
- items()¶
返回事件的项。
- keys()¶
返回事件的键。
- values()¶
从事件字典中的键-值对返回值。
- __len__()¶
返回事件数。
- __getitem__(key)¶
使用给定的键获取事件的值。
- __setitem__(key, val)¶
将项目添加到事件字典。
- __delitem__(key)¶
删除具有给定密钥的事件。
- __iter__()¶
迭代事件字典中出现的键。
- __contains__(key)¶
如果事件判定包含键,则返回True。
- class Bio.Phylo.PhyloXML.Id(value, provider=None)¶
基类:
PhyloElement
通用标识符元素。
允许指示标识符的提供者(或权威机构),例如NCBI,以及值本身。
- __init__(value, provider=None)¶
初始化标识符对象的值。
- __str__()¶
以字符串形式返回标识符。
- class Bio.Phylo.PhyloXML.MolSeq(value, is_aligned=None)¶
基类:
PhyloElement
存储分子序列。
- 参数:
- 价值字符串
序列本身
- is_aligned布尔尔
如果此序列与其他序列对齐,则为True(通常表示所有对齐的序列长度相同,可能存在间隙)
- re_value = re.compile('[a-zA-Z\\.\\-\\?\\*_]+')¶
- __init__(value, is_aligned=None)¶
初始化MolSeq对象的参数。
- __str__()¶
返回分子序列对象的值。
- class Bio.Phylo.PhyloXML.Point(geodetic_datum, lat, long, alt=None, alt_unit=None)¶
基类:
PhyloElement
点的地理坐标,具有可选的高度。
由元素“分发”使用。
- 参数:
- geodetic_datum字符串,必填
大地基准面(也称为地图基准面)。例如,谷歌的KML使用“WGS84”。
- 稍后数字
纬度
- 长数字
经度
- 替代数字
海拔高度
- alt_unit字符串
高度单位(例如‘米’)
- __init__(geodetic_datum, lat, long, alt=None, alt_unit=None)¶
初始化点对象的值。
- class Bio.Phylo.PhyloXML.Polygon(points=None)¶
基类:
PhyloElement
由“点”列表定义的多边形(由元素“分布”使用)。
- 参数:
points -- 表示顶点的3个或更多点的列表。
- __init__(points=None)¶
初始化多边形对象的值。
- __str__()¶
以字符串形式返回点列表。
- class Bio.Phylo.PhyloXML.Property(value, ref, applies_to, datatype, unit=None, id_ref=None)¶
基类:
PhyloElement
来自外部资源的类型化和引用的属性。
可以附加到
Phylogeny
,Clade
,以及Annotation
对象。- 参数:
- 价值字符串
属性的值
- 参考字符串
对外部资源的引用,例如“美国国家海洋和大气局:深度”
- applies_to字符串
指示属性应用到的项(例如,“node”表示分支的父节点,“parent_Branch”表示分支的父分支,或仅“clade”)。
- 数据类型字符串
属性的类型;限制为xsd-datatypes(例如,‘xsd:string’、‘xsd:boolean’、‘xsd:Integer’、‘xsd:decimal’、‘xsd:Float’、‘xsd:Double’、‘xsd:date’、‘xsd:anyURI’)。
- 单位字符串(可选)
财产的单位,例如“公制:M”
- id_refID(可选)
允许将属性专门附加到一个元素(在XML级别)
- re_ref = re.compile('[a-zA-Z0-9_]+:[a-zA-Z0-9_\\.\\-\\s]+')¶
- ok_applies_to = {'annotation', 'clade', 'node', 'other', 'parent_branch', 'phylogeny'}¶
- ok_datatype = {'xsd:anyURI', 'xsd:base64Binary', 'xsd:boolean', 'xsd:byte', 'xsd:date', 'xsd:dateTime', 'xsd:decimal', 'xsd:double', 'xsd:duration', 'xsd:float', 'xsd:gDay', 'xsd:gMonth', 'xsd:gMonthDay', 'xsd:gYear', 'xsd:gYearMonth', 'xsd:hexBinary', 'xsd:int', 'xsd:integer', 'xsd:long', 'xsd:negativeInteger', 'xsd:nonNegativeInteger', 'xsd:nonPositiveInteger', 'xsd:normalizedString', 'xsd:positiveInteger', 'xsd:short', 'xsd:string', 'xsd:time', 'xsd:token', 'xsd:unsignedByte', 'xsd:unsignedInt', 'xsd:unsignedLong', 'xsd:unsignedShort'}¶
- __init__(value, ref, applies_to, datatype, unit=None, id_ref=None)¶
初始化Property对象的值。
- class Bio.Phylo.PhyloXML.ProteinDomain(value, start, end, confidence=None, id=None)¶
基类:
PhyloElement
表示域体系结构中的单个域。
与包括SeqFeature在内的大多数Python对象一样,位置使用从0开始的索引,而不是通常从1开始的生物约定。这意味着可以直接将start和end属性用作Seq对象的切片索引。
- 参数:
- 开始非负整数
序列上的域的开始,使用从0开始的索引
- 结束非负整数
序列上结构域的结尾
- 信心浮动
可用于存储例如E值
- ID号字符串
唯一标识符/名称
- __init__(value, start, end, confidence=None, id=None)¶
初始化ProteinDomain对象的值。
- classmethod from_seqfeature(feat)¶
从SeqFeature创建ProteinDomain对象。
- to_seqfeature()¶
从ProteinDomain对象创建SeqFeature。
- class Bio.Phylo.PhyloXML.Reference(doi=None, desc=None)¶
基类:
PhyloElement
一个分支的文献参考。
注:只要有可能,请使用
doi
属性而不是自由文本desc
元素。- re_doi = re.compile('[a-zA-Z0-9_\\.]+/[a-zA-Z0-9_\\.]+')¶
- __init__(doi=None, desc=None)¶
初始化引用类对象的元素。
- class Bio.Phylo.PhyloXML.Sequence(type=None, id_ref=None, id_source=None, symbol=None, accession=None, name=None, location=None, mol_seq=None, uri=None, domain_architecture=None, annotations=None, other=None)¶
基类:
PhyloElement
与节点相关的分子序列(蛋白质、DNA、RNA)。
一个预定的用途是
id_ref
是将序列链接到分类法(通过分类法的id_source
)在每个节点有多个序列和分类的情况下。- 参数:
- 类型{‘DNA’,‘RNA’,‘蛋白质’}
此序列代表的分子类型
- id_ref字符串
对另一资源的引用
- id_source字符串
参考资料的来源
- 符号字符串
序列的简短符号,例如‘ACTM’(最大10个字符)
- 加入加入
此序列的登录码。
- 名字字符串
序列的全名,例如‘肌肉肌动蛋白’
- 位置
序列在基因组/染色体上的位置。
- mol_seqMolSeq
分子序列本身
- URIURI
链接
- 注释注释对象列表
关于此序列的注释
- domain_architectureDomainArchitecture
该序列上的蛋白质结构域
- 其他其他对象列表
非phyloXML元素
- types = {'dna', 'protein', 'rna'}¶
- re_symbol = re.compile('\\S{1,10}')¶
- __init__(type=None, id_ref=None, id_source=None, symbol=None, accession=None, name=None, location=None, mol_seq=None, uri=None, domain_architecture=None, annotations=None, other=None)¶
初始化序列对象的值。
- classmethod from_seqrecord(record, is_aligned=None)¶
从SeqRecord对象创建新的PhyloXML序列。
- to_seqrecord()¶
从此序列实例创建SeqRecord对象。
seqrecord.Annotation字典的打包方式如下::
{ # Sequence attributes with no SeqRecord equivalent: 'id_ref': self.id_ref, 'id_source': self.id_source, 'location': self.location, 'uri': { 'value': self.uri.value, 'desc': self.uri.desc, 'type': self.uri.type }, # Sequence.annotations attribute (list of Annotations) 'annotations': [{'ref': ann.ref, 'source': ann.source, 'evidence': ann.evidence, 'type': ann.type, 'confidence': [ann.confidence.value, ann.confidence.type], 'properties': [{'value': prop.value, 'ref': prop.ref, 'applies_to': prop.applies_to, 'datatype': prop.datatype, 'unit': prop.unit, 'id_ref': prop.id_ref} for prop in ann.properties], } for ann in self.annotations], }
- class Bio.Phylo.PhyloXML.SequenceRelation(type, id_ref_0, id_ref_1, distance=None, confidence=None)¶
基类:
PhyloElement
表示两个序列之间的类型化关系。
例如,这可以用于描述正字法(在这种情况下,属性“type”是“Orthology”)。
- 参数:
- id_ref_0ID号
第一序列参考标识符
- id_ref_1ID号
第二序列参考标识符
- 距离浮动
两个序列之间的距离
- 类型受限字符串
描述关系类型
- 信心信心
此关系的置信度
- ok_type = {'one_to_one_orthology', 'orthology', 'other', 'paralogy', 'super_orthology', 'ultra_paralogy', 'unknown', 'xenology'}¶
- __init__(type, id_ref_0, id_ref_1, distance=None, confidence=None)¶
初始化类。
- class Bio.Phylo.PhyloXML.Taxonomy(id_source=None, id=None, code=None, scientific_name=None, authority=None, rank=None, uri=None, common_names=None, synonyms=None, other=None)¶
基类:
PhyloElement
描述分支的分类信息。
- 参数:
- id_sourceID号
将其他元素链接到分类法(在XML级别)
- ID号ID号
分类单元的唯一标识符,例如,加州海兔的ID(‘6500’,Provider=‘NCBI_TATIONY’)
- 代码受限字符串
存储UniProt/Swiss-Prot样式的有机体代码,例如加州海兔‘Aplysia calfornica’的‘APLCA’
- scientific_name字符串
这种生物的标准学名,例如加州海兔的“Aplysia calfornica”
- 权威机构字符串
保持权威,如‘J.G.Cooper,1863’,与‘Science_name’相关联
- common_names字符串列表
这种有机体的通用名称
- 同义词字符串列表
这个分类单元的同义词是什么?
- 排名受限字符串
分类等级
- URIURI
链接
- 其他其他对象列表
非phyloXML元素
- re_code = re.compile('[a-zA-Z0-9_]{2,10}')¶
- ok_rank = {'branch', 'class', 'cohort', 'cultivar', 'division', 'domain', 'family', 'form', 'genus', 'infraclass', 'infracohort', 'infradivision', 'infrakingdom', 'infralegion', 'infraphylum', 'infratribe', 'kingdom', 'legion', 'microphylum', 'order', 'other', 'phylum', 'species', 'subclass', 'subcohort', 'subdivision', 'subfamily', 'subform', 'subgenus', 'subkingdom', 'sublegion', 'suborder', 'subphylum', 'subspecies', 'subtribe', 'subvariety', 'superclass', 'supercohort', 'superdivision', 'superfamily', 'superlegion', 'superorder', 'superphylum', 'superspecies', 'supertribe', 'tribe', 'unknown', 'variety'}¶
- __init__(id_source=None, id=None, code=None, scientific_name=None, authority=None, rank=None, uri=None, common_names=None, synonyms=None, other=None)¶
初始化类。
- __str__()¶
显示类名和标识属性。
- class Bio.Phylo.PhyloXML.Uri(value, desc=None, type=None)¶
基类:
PhyloElement
统一资源标识符。
通常,这应该是一个URL(例如,链接到网站上的图像,在这种情况下
type
属性可以是“image”,并且desc
可能是“加州海兔的形象”)。- __init__(value, desc=None, type=None)¶
初始化类。
- __str__()¶
返回URI的字符串表示形式。