pandas.Series.duplicated#
- Series.duplicated(keep='first')[源代码]#
表示重复的系列值。
重复的值表示为
True
结果系列中的值。可以指示所有副本、除第一个副本之外的所有副本或除最后一个出现的副本之外的所有副本。- 参数
- keep{‘First’,‘Last’,False},默认为‘First’
处理删除重复项的方法:
‘First’:标记为
True
除了第一次出现的情况。‘last’:标记为重复
True
除了最后一次出现。False
:将所有重复项标记为True
。
- 退货
- 系列 [bool]
指示每个值是否出现在前面的值中的序列。
参见
Index.duplicated
Pandas.Index上的等效方法。
DataFrame.duplicated
Pandas.DataFrame上的等效方法。
Series.drop_duplicates
从系列中删除重复值。
示例
默认情况下,对于每组重复的值,第一个匹配项设置为False,所有其他匹配项设置为True:
>>> animals = pd.Series(['lama', 'cow', 'lama', 'beetle', 'lama']) >>> animals.duplicated() 0 False 1 False 2 True 3 False 4 True dtype: bool
这相当于
>>> animals.duplicated(keep='first') 0 False 1 False 2 True 3 False 4 True dtype: bool
通过使用‘last’,每组重复值的最后一次出现被设置为False,所有其他值被设置为True:
>>> animals.duplicated(keep='last') 0 True 1 False 2 True 3 False 4 False dtype: bool
通过将Keep设置为打开
False
,所有副本均为True:>>> animals.duplicated(keep=False) 0 True 1 False 2 True 3 False 4 True dtype: bool