pandas.DataFrame.plot.scatter#

DataFrame.plot.scatter(x, y, s=None, c=None, **kwargs)[源代码]#

创建具有不同标记点大小和颜色的散点图。

每个点的坐标由两个数据框列定义,并使用实心圆圈表示每个点。这类曲线图有助于看到两个变量之间的复杂相关性。例如,点可以是自然的2D坐标,如地图中的经度和纬度,或者通常是可以相互绘制的任何一对度量。

参数
x整型或字符串

要用作每个点的水平坐标的列名或列位置。

y整型或字符串

要用作每个点的垂直坐标的列名或列位置。

s字符串,标量或类似数组,可选

每个点的大小。可能的值包括:

  • 一个字符串,其中包含用于标记大小的列的名称。

  • 单个标量,以便所有点具有相同的大小。

  • 一个标量序列,将递归地用于每个点的大小。例如,当通过时 [2,14] 所有点的大小将是2或14,或者。

    在 1.1.0 版更改.

size字符串,标量或类似数组,可选

%s的别名。

1.5.0 新版功能.

c字符串、整型或类似数组,可选

每个点的颜色。可能的值包括:

  • 按名称、RGB或RGBA代码引用的单个颜色字符串,例如‘red’或‘#a98d19’。

  • 按名称、RGB或RGBA代码引用的颜色字符串序列,将递归用于每个点的颜色。例如 [“绿色”、“黄色”] 所有的点数都将以绿色或黄色填充,或者是绿色。

  • 其值将用于根据色彩映射表为标记点着色的列名或位置。

color字符串、整型或类似数组,可选

C的别名。

1.5.0 新版功能.

**kwargs

要传递到的关键字参数 DataFrame.plot()

退货
matplotlib.axes.Axes 或者数不胜数。

参见

matplotlib.pyplot.scatter

使用多种输入数据格式的散点图。

示例

让我们看看如何使用DataFrame列中的值的坐标绘制散点图。

>>> df = pd.DataFrame([[5.1, 3.5, 0], [4.9, 3.0, 0], [7.0, 3.2, 1],
...                    [6.4, 3.2, 1], [5.9, 3.0, 2]],
...                   columns=['length', 'width', 'species'])
>>> ax1 = df.plot.scatter(x='length',
...                       y='width',
...                       c='DarkBlue')
../../_images/pandas-DataFrame-plot-scatter-1.png

现在,颜色也由一列来确定。

>>> ax2 = df.plot.scatter(x='length',
...                       y='width',
...                       c='species',
...                       colormap='viridis')
../../_images/pandas-DataFrame-plot-scatter-2.png