cosine_similarity#

sklearn.metrics.pairwise.cosine_similarity(X, Y=None, dense_output=True)[源代码]#

计算X和Y中样本之间的cos相似度。

Cosine相似度或Cosine核将相似度计算为X和Y的规范化点积:

K(X, Y) = <X, Y> / (||X||*||Y||)

在L2标准化数据上,此函数等效于linear_kernel。

阅读更多的 User Guide .

参数:
X形状(n_samples_X,n_features)的{类数组,稀疏矩阵}

输入数据。

Y形状(n_samples_Y,n_features)的{类数组,稀疏矩阵}, 默认值=无

输入数据。如果 None ,输出将是中所有样本之间的成对相似度 X .

dense_output布尔,默认=True

即使输入稀疏,是否返回密集输出。如果 False ,如果两个输入数组都是稀疏的,则输出是稀疏的。

Added in version 0.17: 参数 dense_output 用于高密度输出。

返回:
similaritiesndarray或形状的稀疏矩阵(n_samples_X,n_samples_Y)

返回X和Y中样本之间的cos相似度。

示例

>>> from sklearn.metrics.pairwise import cosine_similarity
>>> X = [[0, 0, 0], [1, 1, 1]]
>>> Y = [[1, 0, 0], [1, 1, 0]]
>>> cosine_similarity(X, Y)
array([[0.     , 0.     ],
       [0.57..., 0.81...]])