pandas.Index.drop_duplicates#

Index.drop_duplicates(keep='first')[源代码]#

返回删除了重复值的索引。

参数
keep :{‘第一’,‘最后’, False },默认为‘First’{‘第一个’,‘最后一个’,
  • ‘First’:删除除第一个匹配项以外的重复项。

  • ‘last’:删除除最后一个匹配项以外的重复项。

  • False :删除所有重复项。

退货
deduplicated索引

参见

Series.drop_duplicates

级数的等价法。

DataFrame.drop_duplicates

DataFrame上的等效方法。

Index.duplicated

Index上的Related方法,指示索引值重复。

示例

生成具有重复值的Pandas.Index。

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama', 'hippo'])

这个 keep 参数控制删除哪些重复值。值‘first’保留每组重复条目的第一个匹配项。Keep的缺省值为‘First’。

>>> idx.drop_duplicates(keep='first')
Index(['lama', 'cow', 'beetle', 'hippo'], dtype='object')

值‘last’保存每组重复条目的最后一个匹配项。

>>> idx.drop_duplicates(keep='last')
Index(['cow', 'beetle', 'lama', 'hippo'], dtype='object')

它的价值 False 丢弃所有重复条目集。

>>> idx.drop_duplicates(keep=False)
Index(['cow', 'beetle', 'hippo'], dtype='object')