sklearn.random_projection#

随机投影变压器。

随机预测是一种简单且计算高效的方法,可以通过牺牲受控的准确度(作为额外方差)来减少数据维度,以获得更快的处理时间和更小的模型大小。

控制随机投影矩阵的维度和分布,以保留数据集任何两个样本之间的成对距离。

随机投影效率背后的主要理论结果是 Johnson-Lindenstrauss lemma (quoting Wikipedia) :

在数学中,约翰逊-林登施特劳斯引理是关于点从多维到低维欧几里得空间的低失真嵌入的结果。该引理指出,多维空间中的一小群点可以嵌入到低维得多的空间中,以使点之间的距离几乎保持不变。用于嵌入的地图至少是Lipschitz,甚至可以被视为一个正交投影。

User guide. 看到 随机投影 部分了解更多详细信息。

GaussianRandomProjection

通过高斯随机投影降低维度。

SparseRandomProjection

通过稀疏随机投影降低维度。

johnson_lindenstrauss_min_dim

找到“安全”数量的组件来随机投影。