pandas.core.groupby.GroupBy.mean#
- final GroupBy.mean(numeric_only=NoDefault.no_default, engine='cython', engine_kwargs=None)[源代码]#
计算组的平均值,不包括缺失值。
- 参数
- numeric_only布尔值,默认为True
包括浮点型、整型、布尔型列。如果没有,将尝试使用所有内容,然后仅使用数字数据。
- engine字符串,默认为无
'cython'
:从cython通过C扩展运行操作。'numba'
:通过来自Numba的JIT编译代码运行操作。None
: Defaults to'cython'
or globally settingcompute.use_numba
1.4.0 新版功能.
- engine_kwargsDict,默认无
为
'cython'
发动机,有没有接受engine_kwargs
为
'numba'
发动机,发动机可以接受nopython
,nogil
和parallel
词典的关键字。这些值必须是True
或False
。默认设置engine_kwargs
对于'numba'
引擎是{{{{'nopython': True, 'nogil': False, 'parallel': False}}}}
1.4.0 新版功能.
- 退货
- Pandas.Series或Pandas.DataFrame
参见
Series.groupby
将函数GROUPBY应用于系列。
DataFrame.groupby
将函数GROUPBY应用于DataFrame的每行或每列。
示例
>>> df = pd.DataFrame({'A': [1, 1, 2, 1, 2], ... 'B': [np.nan, 2, 3, 4, 5], ... 'C': [1, 2, 1, 1, 2]}, columns=['A', 'B', 'C'])
按一列分组,并返回每组中剩余列的平均值。
>>> df.groupby('A').mean() B C A 1 3.0 1.333333 2 4.0 1.500000
按两列分组,并返回剩余列的平均值。
>>> df.groupby(['A', 'B']).mean() C A B 1 2.0 2.0 4.0 1.0 2 3.0 1.0 5.0 2.0
按一列分组,并仅返回组中特定列的平均值。
>>> df.groupby('A')['B'].mean() A 1 3.0 2 4.0 Name: B, dtype: float64