skbio.diversity.block_beta_diversity¶

skbio.diversity.block_beta_diversity(metric, counts, ids, validate=True, k=64, reduce_f=None, map_f=None, **kwargs)[源代码]¶

执行块分解beta分集计算

状态：从0.5.1开始试验。

参数:

metric (str or callable) -- 要应用的成对距离函数。如果 metric 是一个字符串，它必须可以由scikit-bio解析（例如UniFrac方法），或者必须是可调用的。
counts (2D array_like of ints or floats) -- 包含计数/丰度数据的矩阵，其中每行包含给定样本中OTU的计数。
ids (iterable of strs) -- 中每个样本的标识符 counts .
validate (bool, optional) -- 见 skbio.diversity.beta_diversity 有关详细信息。
reduce_f (function, optional) -- 一种减少 PartialDistanceMatrix 对象合并为一个 DistanceMatrix . 预期签名为： f(Iterable of DistanceMatrix) -> DistanceMatrix 注意，这是map/reduce中的reduce。
map_f (function, optional) -- 一种接受 _block_compute . 预期签名为： f(**kwargs) -> DistanceMatrix 注：ipyparallel's map_async 不能在这里工作，因为我们需要能四处走动 **kwargs '.
k (int, optional) -- 计算距离时使用的块大小
kwargs (kwargs, optional) -- 公制特定参数。

返回:

用计数表示的所有样本之间的距离矩阵。

返回类型:

DistanceMatrix

备注

这种方法是为了便于并行计算beta分集。一般来说，如果您正在处理几百个或更少的样本，那么很可能是 skbio.diversity.beta_diversity 会更快。推动这种方法发展的最初需要是处理地球微生物组项目 [1] 当时数据集跨越25000个样本和750万个开放参考OTU。

参见

引用