pandas.DataFrame.diff#

DataFrame.diff(periods=1, axis=0)[源代码]#

单元的一阶离散差分。

计算DataFrame元素与DataFrame中的另一个元素之间的差异(默认为上一行中的元素)。

参数
periods整型,默认值为1

用于计算差异的移动期,接受负值。

axis{0或‘index’,1或‘Columns’},默认为0

取行(0)或列(1)的差值。

退货
DataFrame

系列的第一个不同之处。

参见

DataFrame.pct_change

在给定期间数内的百分比变化。

DataFrame.shift

使用可选的时间频率按所需的周期数移动索引。

Series.diff

对象的第一个离散差分。

注意事项

对于布尔数据类型,它使用 operator.xor() 而不是 operator.sub() 。根据DataFrame中的当前数据类型计算结果,但结果的数据类型始终为Float64。

示例

与上一行的差异

>>> df = pd.DataFrame({'a': [1, 2, 3, 4, 5, 6],
...                    'b': [1, 1, 2, 3, 5, 8],
...                    'c': [1, 4, 9, 16, 25, 36]})
>>> df
   a  b   c
0  1  1   1
1  2  1   4
2  3  2   9
3  4  3  16
4  5  5  25
5  6  8  36
>>> df.diff()
     a    b     c
0  NaN  NaN   NaN
1  1.0  0.0   3.0
2  1.0  1.0   5.0
3  1.0  1.0   7.0
4  1.0  2.0   9.0
5  1.0  3.0  11.0

与前一专栏的不同

>>> df.diff(axis=1)
    a  b   c
0 NaN  0   0
1 NaN -1   3
2 NaN -1   7
3 NaN -1  13
4 NaN  0  20
5 NaN  2  28

与上一行第三行的差异

>>> df.diff(periods=3)
     a    b     c
0  NaN  NaN   NaN
1  NaN  NaN   NaN
2  NaN  NaN   NaN
3  3.0  2.0  15.0
4  3.0  4.0  21.0
5  3.0  6.0  27.0

与后面的行不同

>>> df.diff(periods=-1)
     a    b     c
0 -1.0  0.0  -3.0
1 -1.0 -1.0  -5.0
2 -1.0 -1.0  -7.0
3 -1.0 -2.0  -9.0
4 -1.0 -3.0 -11.0
5  NaN  NaN   NaN

输入数据类型中的溢出

>>> df = pd.DataFrame({'a': [1, 0]}, dtype=np.uint8)
>>> df.diff()
       a
0    NaN
1  255.0