skbio.diversity.block_beta_diversity¶
- skbio.diversity.block_beta_diversity(metric, counts, ids, validate=True, k=64, reduce_f=None, map_f=None, **kwargs)[源代码]¶
执行块分解beta分集计算
状态:从0.5.1开始试验。
- 参数:
metric (str or callable) -- 要应用的成对距离函数。如果
metric
是一个字符串,它必须可以由scikit-bio解析(例如UniFrac方法),或者必须是可调用的。counts (2D array_like of ints or floats) -- 包含计数/丰度数据的矩阵,其中每行包含给定样本中OTU的计数。
ids (iterable of strs) -- 中每个样本的标识符
counts
.validate (bool, optional) -- 见
skbio.diversity.beta_diversity
有关详细信息。reduce_f (function, optional) -- 一种减少 PartialDistanceMatrix 对象合并为一个 DistanceMatrix . 预期签名为: f(Iterable of DistanceMatrix) -> DistanceMatrix 注意,这是map/reduce中的reduce。
map_f (function, optional) -- 一种接受 _block_compute . 预期签名为: f(**kwargs) -> DistanceMatrix 注:ipyparallel's map_async 不能在这里工作,因为我们需要能四处走动 **kwargs '.
k (int, optional) -- 计算距离时使用的块大小
kwargs (kwargs, optional) -- 公制特定参数。
- 返回:
用计数表示的所有样本之间的距离矩阵。
- 返回类型:
备注
这种方法是为了便于并行计算beta分集。一般来说,如果您正在处理几百个或更少的样本,那么很可能是 skbio.diversity.beta_diversity 会更快。推动这种方法发展的最初需要是处理地球微生物组项目 [1] 当时数据集跨越25000个样本和750万个开放参考OTU。
引用