seaborn.
boxplot
(*, x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None, palette=None, saturation=0.75, width=0.8, dodge=True, fliersize=5, linewidth=None, whis=1.5, ax=None, **kwargs)¶绘制一个方框图来显示关于类别的分布。
盒状图(或盒须图)以便于变量之间或分类变量水平之间比较的方式显示定量数据的分布。该框显示数据集的四分位数,而胡须扩展显示分布的其余部分,但使用四分位数范围函数的方法确定为“异常值”的点除外。
输入数据可以以多种格式传递,包括:
表示为列表、numpy数组或直接传递给 x
, y
和/或 hue
参数。
“长格式”数据帧,在这种情况下 x
, y
和 hue
变量将决定如何绘制数据。
一个“宽格式”数据框,这样每个数字列都将被打印出来。
向量的数组或列表。
在大多数情况下,可以使用numpy或Python对象,但最好使用pandas对象,因为关联的名称将用于注释轴。此外,可以对分组变量使用分类类型来控制绘图元素的顺序。
此函数始终将其中一个变量视为分类变量,并在顺序位置(0,1。。。n) 在相关轴上,即使数据具有数字或日期类型。
见 tutorial 更多信息。
data
或矢量数据,可选中变量的名称用于绘制长格式数据的输入。解释见示例。
用于打印的数据集。如果 x
和 y
不存在,这被解释为广义形式。否则它将是长格式的。
以绘制中的分类级别,否则级别是从数据对象推断出来的。
绘图的水平方向或垂直方向。这通常是根据输入变量的类型推断出来的,但当两者都存在时,它可以用来解决含糊不清的问题 x
和 y
是数字或打印宽格式数据时。
所有元素的颜色,或渐变调色板的种子。
用于不同级别的 hue
变量。应该是可以解释的东西 color_palette()
,或将色调级别映射到matplotlib颜色的字典。
以原始饱和度的比例绘制颜色。大的补丁通常看起来更好,稍微去饱和的颜色,但设置这个 1
如果希望打印颜色与输入颜色规范完全匹配。
不使用色调嵌套时完整元素的宽度,或主分组变量的一个级别的所有元素的宽度。
使用色调嵌套时,元素是否应沿分类轴移动。
用于指示异常观测值的标记的大小。
构成绘图元素的灰色线的宽度。
IQR的比例超过了高低四分位数,从而延伸出图中的晶须。超出此范围的点将被识别为异常值。
轴对象,否则使用当前轴。
其他关键字参数传递给 matplotlib.axes.Axes.boxplot()
.
返回绘制了绘图的轴对象。
参见
violinplot
箱线图和核密度估计的结合。
stripplot
一个变量是绝对变量的散点图。可以与其他绘图一起使用来显示每个观察结果。
swarmplot
点不重叠的分类散点图。可与其他绘图一起使用以显示每个观察结果。
catplot
把一个明确的情节与另一个情节结合起来 FacetGrid
.
实例
绘制单个水平箱线图:
>>> import seaborn as sns
>>> sns.set_theme(style="whitegrid")
>>> tips = sns.load_dataset("tips")
>>> ax = sns.boxplot(x=tips["total_bill"])
绘制按分类变量分组的垂直箱线图:
>>> ax = sns.boxplot(x="day", y="total_bill", data=tips)
绘制由两个分类变量嵌套分组的箱线图:
>>> ax = sns.boxplot(x="day", y="total_bill", hue="smoker",
... data=tips, palette="Set3")
当某些箱子为空时,绘制嵌套分组的箱线图:
>>> ax = sns.boxplot(x="day", y="total_bill", hue="time",
... data=tips, linewidth=2.5)
通过传递显式命令来控制框顺序:
>>> ax = sns.boxplot(x="time", y="tip", data=tips,
... order=["Dinner", "Lunch"])
为数据框中的每个数字变量绘制方框图:
>>> iris = sns.load_dataset("iris")
>>> ax = sns.boxplot(data=iris, orient="h", palette="Set2")
使用 hue
在不改变盒子位置或宽度的情况下:
>>> tips["weekend"] = tips["day"].isin(["Sat", "Sun"])
>>> ax = sns.boxplot(x="day", y="total_bill", hue="weekend",
... data=tips, dodge=False)
使用 swarmplot()
要在方框顶部显示数据点:
>>> ax = sns.boxplot(x="day", y="total_bill", data=tips)
>>> ax = sns.swarmplot(x="day", y="total_bill", data=tips, color=".25")
使用 catplot()
合并 boxplot()
和A FacetGrid
. 这允许在其他分类变量中进行分组。使用 catplot()
比使用更安全 FacetGrid
直接,因为它确保了跨方面的可变顺序的同步:
>>> g = sns.catplot(x="sex", y="total_bill",
... hue="smoker", col="time",
... data=tips, kind="box",
... height=4, aspect=.7);