skbio.stats.distance.DissimilarityMatrix¶
- class skbio.stats.distance.DissimilarityMatrix(data, ids=None, validate=True)[源代码]¶
存储对象之间的差异。
A DissimilarityMatrix 实例存储对象之间不同之处的正方形、中空、二维矩阵。例如,对象可以是样本或DNA序列。这些不同之处伴随着一系列ID。
提供了从磁盘加载相异矩阵和将相异矩阵保存到磁盘的方法,以及执行常见操作,例如基于对象ID提取相异度。
- 参数:
data (array_like or DissimilarityMatrix) -- 正方形、中空、二维
numpy.ndarray
不同点(浮点数)的结构,或者可以转换为numpy.ndarray
使用numpy.asarray
或一维相异度向量(浮点数),如 scipy.spatial.distance.squareform 。可以改为是一个 DissimilarityMatrix (或子类)实例,在这种情况下将使用实例的数据。数据将转换为浮点型dtype
如果有必要的话。一份复印件 not 如果已经是numpy.ndarray
使用浮点数dtype
。ids (sequence of str, optional) -- 用作对象ID的字符串序列。必须与中的行数/列数匹配 data 。如果
None
(默认),ID将是单调递增的整数,转换为字符串,编号从零开始,例如,('0', '1', '2', '3', ...)
。validate (bool, optional) -- 如果 validate 是
True
(默认设置),并且数据不是DisimilarityMatrix对象,则将验证输入数据。
备注
相异点以冗余(正方形)格式存储 [1].
不检查数据的对称性,也不保证/假定数据是对称的。
引用
属性
T
相异矩阵的转置。
data
一系列不同之处。
default_write_format
dtype
不同的数据类型。
ids
对象ID的元组。
png
在IPython笔记本中以PNG格式显示热图。
shape
包含相异矩阵维度的双元素元组。
size
相异矩阵中的元素总数。
svg
在IPython笔记本中以SVG格式显示热图。
内嵌函数
__contains__
(lookup_id)检查指定的ID是否在相异度矩阵中。
__eq__
(其他)将此相异矩阵与另一个矩阵进行比较,以求相等。
__ge__
(value, /)返回self>=值。
__getitem__
\(索引)按对象ID或NumPy索引将不同的数据切片。
__getstate__
\()泡菜的帮手。
__gt__
(value, /)返回self>值。
__le__
(value, /)返回self<=value。
__lt__
(value, /)返回self<value。
__ne__
(其他)确定两个相异矩阵是否不相等。
__str__
\()返回相异矩阵的字符串表示形式。
方法
between
(from_, to_[, allow_overlap])获取两组ID之间的距离
copy
\()返回相异矩阵的深层副本。
filter
(ids[, strict])根据ID过滤相异度矩阵。
from_iterable
(iterable, metric[, key, keys])从给定度量的可迭代项创建DisimilarityMatrix。
index
(lookup_id)返回指定ID的索引。
plot
([cmap, title])创建相异矩阵的热图
read
(file[, format])创建新的
DissimilarityMatrix
实例。redundant_form
\()返回冗余格式的相异度数组。
to_data_frame
\()创建
pandas.DataFrame
从这个开始DissimilarityMatrix
。transpose
\()返回相异矩阵的转置。
within
\(ID)获取ID集合中的所有距离
write
(file[, format])编写一个实例
DissimilarityMatrix
保存到文件中。