pandas.DataFrame.transform#
- DataFrame.transform(func, axis=0, *args, **kwargs)[源代码]#
打电话
func
关于Self生成与Self具有相同轴形状的DataFrame。- 参数
- func函数、字符串、列表或字典
用于转换数据的函数。如果是函数,则在传递DataFrame或传递给DataFrame.Apply时必须工作。如果Func既是List-like,又是dict-like,则类dict行为优先。
可接受的组合包括:
功能
字符串函数名
类似函数和/或函数名称的列表,例如
[np.exp, 'sqrt']
类似字典的轴标签->函数、函数名称或类似列表。
- axis{0或‘index’,1或‘Columns’},默认为0
如果为0或‘index’:将函数应用于每一列。If 1或‘Columns’:对每行应用函数。
- *args
要传递到的位置参数 func 。
- **kwargs
要传递到的关键字参数 func 。
- 退货
- DataFrame
必须与Self具有相同长度的DataFrame。
- 加薪
- ValueError如果返回的DataFrame的长度与自身的长度不同。
参见
DataFrame.agg
仅执行聚合类型操作。
DataFrame.apply
调用DataFrame上的函数。
注意事项
改变传递的对象的函数可能会产生意外的行为或错误,因此不受支持。看见 使用用户定义函数(UDF)方法进行变异 了解更多详细信息。
示例
>>> df = pd.DataFrame({'A': range(3), 'B': range(1, 4)}) >>> df A B 0 0 1 1 1 2 2 2 3 >>> df.transform(lambda x: x + 1) A B 0 1 2 1 2 3 2 3 4
即使生成的DataFrame必须与输入DataFrame具有相同的长度,也可以提供几个输入函数:
>>> s = pd.Series(range(3)) >>> s 0 0 1 1 2 2 dtype: int64 >>> s.transform([np.sqrt, np.exp]) sqrt exp 0 0.000000 1.000000 1 1.000000 2.718282 2 1.414214 7.389056
您可以对GroupBy对象调用Transform:
>>> df = pd.DataFrame({ ... "Date": [ ... "2015-05-08", "2015-05-07", "2015-05-06", "2015-05-05", ... "2015-05-08", "2015-05-07", "2015-05-06", "2015-05-05"], ... "Data": [5, 8, 6, 1, 50, 100, 60, 120], ... }) >>> df Date Data 0 2015-05-08 5 1 2015-05-07 8 2 2015-05-06 6 3 2015-05-05 1 4 2015-05-08 50 5 2015-05-07 100 6 2015-05-06 60 7 2015-05-05 120 >>> df.groupby('Date')['Data'].transform('sum') 0 55 1 108 2 66 3 121 4 55 5 108 6 66 7 121 Name: Data, dtype: int64
>>> df = pd.DataFrame({ ... "c": [1, 1, 1, 2, 2, 2, 2], ... "type": ["m", "n", "o", "m", "m", "n", "n"] ... }) >>> df c type 0 1 m 1 1 n 2 1 o 3 2 m 4 2 m 5 2 n 6 2 n >>> df['size'] = df.groupby('c')['type'].transform(len) >>> df c type size 0 1 m 3 1 1 n 3 2 1 o 3 3 2 m 4 4 2 m 4 5 2 n 4 6 2 n 4