skbio.stats.distance.DissimilarityMatrix

class skbio.stats.distance.DissimilarityMatrix(data, ids=None, validate=True)[源代码]

存储对象之间的差异。

A DissimilarityMatrix 实例存储对象之间不同之处的正方形、中空、二维矩阵。例如,对象可以是样本或DNA序列。这些不同之处伴随着一系列ID。

提供了从磁盘加载相异矩阵和将相异矩阵保存到磁盘的方法,以及执行常见操作,例如基于对象ID提取相异度。

参数:
  • data (array_like or DissimilarityMatrix) -- 正方形、中空、二维 numpy.ndarray 不同点(浮点数)的结构,或者可以转换为 numpy.ndarray 使用 numpy.asarray 或一维相异度向量(浮点数),如 scipy.spatial.distance.squareform 。可以改为是一个 DissimilarityMatrix (或子类)实例,在这种情况下将使用实例的数据。数据将转换为浮点型 dtype 如果有必要的话。一份复印件 not 如果已经是 numpy.ndarray 使用浮点数 dtype

  • ids (sequence of str, optional) -- 用作对象ID的字符串序列。必须与中的行数/列数匹配 data 。如果 None (默认),ID将是单调递增的整数,转换为字符串,编号从零开始,例如, ('0', '1', '2', '3', ...)

  • validate (bool, optional) -- 如果 validateTrue (默认设置),并且数据不是DisimilarityMatrix对象,则将验证输入数据。

备注

相异点以冗余(正方形)格式存储 [1].

不检查数据的对称性,也不保证/假定数据是对称的。

引用

属性

T 

相异矩阵的转置。

data 

一系列不同之处。

default_write_format 

dtype 

不同的数据类型。

ids 

对象ID的元组。

png 

在IPython笔记本中以PNG格式显示热图。

shape 

包含相异矩阵维度的双元素元组。

size 

相异矩阵中的元素总数。

svg 

在IPython笔记本中以SVG格式显示热图。

内嵌函数

__contains__(lookup_id)

检查指定的ID是否在相异度矩阵中。

__eq__ (其他)

将此相异矩阵与另一个矩阵进行比较,以求相等。

__ge__(value, /)

返回self>=值。

__getitem__ \(索引)

按对象ID或NumPy索引将不同的数据切片。

__getstate__ \()

泡菜的帮手。

__gt__(value, /)

返回self>值。

__le__(value, /)

返回self<=value。

__lt__(value, /)

返回self<value。

__ne__ (其他)

确定两个相异矩阵是否不相等。

__str__ \()

返回相异矩阵的字符串表示形式。

方法

between(from_, to_[, allow_overlap])

获取两组ID之间的距离

copy \()

返回相异矩阵的深层副本。

filter(ids[, strict])

根据ID过滤相异度矩阵。

from_iterable(iterable, metric[, key, keys])

从给定度量的可迭代项创建DisimilarityMatrix。

index(lookup_id)

返回指定ID的索引。

plot([cmap, title])

创建相异矩阵的热图

read(file[, format])

创建新的 DissimilarityMatrix 实例。

redundant_form \()

返回冗余格式的相异度数组。

to_data_frame \()

创建 pandas.DataFrame 从这个开始 DissimilarityMatrix

transpose \()

返回相异矩阵的转置。

within \(ID)

获取ID集合中的所有距离

write(file[, format])

编写一个实例 DissimilarityMatrix 保存到文件中。