cosine_similarity#
- sklearn.metrics.pairwise.cosine_similarity(X, Y=None, dense_output=True)[源代码]#
计算X和Y中样本之间的cos相似度。
Cosine相似度或Cosine核将相似度计算为X和Y的规范化点积:
K(X, Y) = <X, Y> / (||X||*||Y||)
在L2标准化数据上,此函数等效于linear_kernel。
阅读更多的 User Guide .
- 参数:
- X形状(n_samples_X,n_features)的{类数组,稀疏矩阵}
输入数据。
- Y形状(n_samples_Y,n_features)的{类数组,稀疏矩阵}, 默认值=无
输入数据。如果
None
,输出将是中所有样本之间的成对相似度X
.- dense_output布尔,默认=True
即使输入稀疏,是否返回密集输出。如果
False
,如果两个输入数组都是稀疏的,则输出是稀疏的。Added in version 0.17: 参数
dense_output
用于高密度输出。
- 返回:
- similaritiesndarray或形状的稀疏矩阵(n_samples_X,n_samples_Y)
返回X和Y中样本之间的cos相似度。
示例
>>> from sklearn.metrics.pairwise import cosine_similarity >>> X = [[0, 0, 0], [1, 1, 1]] >>> Y = [[1, 0, 0], [1, 1, 0]] >>> cosine_similarity(X, Y) array([[0. , 0. ], [0.57..., 0.81...]])