haversine_distances#

sklearn.metrics.pairwise.haversine_distances(X, Y=None)[源代码]#

计算X和Y中样本之间的半轴距离。

半轴(或大圆)距离是球体表面两点之间的角距离。假设每个点的第一个坐标是纬度,第二个坐标是经度,以弧度给出。数据的维度必须为2。

\[D(x, y) = 2\arcsin[\sqrt{\sin^2((x_{lat} - y_{lat}) / 2) + \cos(x_{lat})\cos(y_{lat})\ sin^2((x_{lon} - y_{lon}) / 2)}]\]
参数:
X形状(n_samples_X,2)的{类数组,稀疏矩阵}

特征数组。

Y形状(n_samples_Y,2)的{类数组,稀疏矩阵},默认=无

可选的第二特征阵列。如果 None ,用途 Y=X .

返回:
distances形状的nd数组(n_samples_X,n_samples_Y)

距离矩阵。

注意到

由于地球几乎是球形的,半轴公式提供了地球表面两点之间距离的良好近似,平均误差小于1%。

示例

我们想要计算Ezeiza机场(阿根廷布宜诺斯艾利斯)和戴高乐机场(法国巴黎)之间的距离。

>>> from sklearn.metrics.pairwise import haversine_distances
>>> from math import radians
>>> bsas = [-34.83333, -58.5166646]
>>> paris = [49.0083899664, 2.53844117956]
>>> bsas_in_radians = [radians(_) for _ in bsas]
>>> paris_in_radians = [radians(_) for _ in paris]
>>> result = haversine_distances([bsas_in_radians, paris_in_radians])
>>> result * 6371000/1000  # multiply by Earth radius to get kilometers
array([[    0.        , 11099.54035582],
       [11099.54035582,     0.        ]])