pandas.Index.drop_duplicates#
- Index.drop_duplicates(keep='first')[源代码]#
返回删除了重复值的索引。
- 参数
- keep :{‘第一’,‘最后’,
False
},默认为‘First’{‘第一个’,‘最后一个’, ‘First’:删除除第一个匹配项以外的重复项。
‘last’:删除除最后一个匹配项以外的重复项。
False
:删除所有重复项。
- keep :{‘第一’,‘最后’,
- 退货
- deduplicated索引
参见
Series.drop_duplicates
级数的等价法。
DataFrame.drop_duplicates
DataFrame上的等效方法。
Index.duplicated
Index上的Related方法,指示索引值重复。
示例
生成具有重复值的Pandas.Index。
>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama', 'hippo'])
这个 keep 参数控制删除哪些重复值。值‘first’保留每组重复条目的第一个匹配项。Keep的缺省值为‘First’。
>>> idx.drop_duplicates(keep='first') Index(['lama', 'cow', 'beetle', 'hippo'], dtype='object')
值‘last’保存每组重复条目的最后一个匹配项。
>>> idx.drop_duplicates(keep='last') Index(['cow', 'beetle', 'lama', 'hippo'], dtype='object')
它的价值
False
丢弃所有重复条目集。>>> idx.drop_duplicates(keep=False) Index(['cow', 'beetle', 'hippo'], dtype='object')