skbio.diversity.block_beta_diversity

skbio.diversity.block_beta_diversity(metric, counts, ids, validate=True, k=64, reduce_f=None, map_f=None, **kwargs)[源代码]

执行块分解beta分集计算

状态:从0.5.1开始试验。

参数:
  • metric (str or callable) -- 要应用的成对距离函数。如果 metric 是一个字符串,它必须可以由scikit-bio解析(例如UniFrac方法),或者必须是可调用的。

  • counts (2D array_like of ints or floats) -- 包含计数/丰度数据的矩阵,其中每行包含给定样本中OTU的计数。

  • ids (iterable of strs) -- 中每个样本的标识符 counts .

  • validate (bool, optional) -- 见 skbio.diversity.beta_diversity 有关详细信息。

  • reduce_f (function, optional) -- 一种减少 PartialDistanceMatrix 对象合并为一个 DistanceMatrix . 预期签名为: f(Iterable of DistanceMatrix) -> DistanceMatrix 注意,这是map/reduce中的reduce。

  • map_f (function, optional) -- 一种接受 _block_compute . 预期签名为: f(**kwargs) -> DistanceMatrix 注:ipyparallel's map_async 不能在这里工作,因为我们需要能四处走动 **kwargs '.

  • k (int, optional) -- 计算距离时使用的块大小

  • kwargs (kwargs, optional) -- 公制特定参数。

返回:

用计数表示的所有样本之间的距离矩阵。

返回类型:

DistanceMatrix

备注

这种方法是为了便于并行计算beta分集。一般来说,如果您正在处理几百个或更少的样本,那么很可能是 skbio.diversity.beta_diversity 会更快。推动这种方法发展的最初需要是处理地球微生物组项目 [1] 当时数据集跨越25000个样本和750万个开放参考OTU。

引用