pandas.Index.duplicated#
- Index.duplicated(keep='first')[源代码]#
表示重复的索引值。
重复的值表示为
True
结果数组中的值。可以指示所有副本、除第一个副本之外的所有副本或除最后一个出现的副本之外的所有副本。- 参数
- keep{‘First’,‘Last’,False},默认为‘First’
一组重复项中要标记为缺失的一个或多个值。
‘First’:标记为
True
除了第一次出现的情况。‘last’:标记为重复
True
除了最后一次出现。False
:将所有重复项标记为True
。
- 退货
- np.ndarray[bool]
参见
Series.duplicated
Pandas的等价法。系列。
DataFrame.duplicated
Pandas.DataFrame上的等效方法。
Index.drop_duplicates
从索引中删除重复值。
示例
默认情况下,对于每组重复的值,第一个匹配项设置为False,所有其他匹配项设置为True:
>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama']) >>> idx.duplicated() array([False, False, True, False, True])
这相当于
>>> idx.duplicated(keep='first') array([False, False, True, False, True])
通过使用‘last’,每组重复值的最后一次出现被设置为False,所有其他值被设置为True:
>>> idx.duplicated(keep='last') array([ True, False, True, False, False])
通过将Keep设置为打开
False
,所有副本均为True:>>> idx.duplicated(keep=False) array([ True, False, True, False, True])