pandas.Series.drop_duplicates#

Series.drop_duplicates(keep='first', inplace=False)[源代码]#

已删除重复值的返回系列。

参数
keep :{‘第一’,‘最后’, False },默认为‘First’{‘第一个’,‘最后一个’,

处理删除重复项的方法:

  • ‘First’:删除除第一个匹配项以外的重复项。

  • ‘last’:删除除最后一个匹配项以外的重复项。

  • False :删除所有重复项。

在位 :bool,默认 False布尔,默认

如果 True ,则就地执行操作并返回NONE。

退货
系列或无

已丢弃重复项的系列,如果 inplace=True

参见

Index.drop_duplicates

关于指数的等价方法。

DataFrame.drop_duplicates

DataFrame上的等效方法。

Series.duplicated

系列上的相关方法,表示重复的系列值。

示例

生成具有重复条目的系列。

>>> s = pd.Series(['lama', 'cow', 'lama', 'beetle', 'lama', 'hippo'],
...               name='animal')
>>> s
0      lama
1       cow
2      lama
3    beetle
4      lama
5     hippo
Name: animal, dtype: object

使用‘Keep’参数,可以更改重复值的选择行为。值‘first’保留每组重复条目的第一个匹配项。Keep的缺省值为‘First’。

>>> s.drop_duplicates()
0      lama
1       cow
3    beetle
5     hippo
Name: animal, dtype: object

参数‘Keep’的值‘last’保存每组重复条目的最后一个匹配项。

>>> s.drop_duplicates(keep='last')
1       cow
3    beetle
4      lama
5     hippo
Name: animal, dtype: object

它的价值 False 对于参数‘Keep’,将丢弃所有重复条目集。将“inplace”的值设置为 True 就地执行操作并返回 None

>>> s.drop_duplicates(keep=False, inplace=True)
>>> s
1       cow
3    beetle
5     hippo
Name: animal, dtype: object