pandas.Index.duplicated#

Index.duplicated(keep='first')[源代码]#

表示重复的索引值。

重复的值表示为 True 结果数组中的值。可以指示所有副本、除第一个副本之外的所有副本或除最后一个出现的副本之外的所有副本。

参数
keep{‘First’,‘Last’,False},默认为‘First’

一组重复项中要标记为缺失的一个或多个值。

  • ‘First’:标记为 True 除了第一次出现的情况。

  • ‘last’:标记为重复 True 除了最后一次出现。

  • False :将所有重复项标记为 True

退货
np.ndarray[bool]

参见

Series.duplicated

Pandas的等价法。系列。

DataFrame.duplicated

Pandas.DataFrame上的等效方法。

Index.drop_duplicates

从索引中删除重复值。

示例

默认情况下,对于每组重复的值,第一个匹配项设置为False,所有其他匹配项设置为True:

>>> idx = pd.Index(['lama', 'cow', 'lama', 'beetle', 'lama'])
>>> idx.duplicated()
array([False, False,  True, False,  True])

这相当于

>>> idx.duplicated(keep='first')
array([False, False,  True, False,  True])

通过使用‘last’,每组重复值的最后一次出现被设置为False,所有其他值被设置为True:

>>> idx.duplicated(keep='last')
array([ True, False,  True, False, False])

通过将Keep设置为打开 False ,所有副本均为True:

>>> idx.duplicated(keep=False)
array([ True, False,  True, False,  True])