pandas.Series.duplicated#

Series.duplicated(keep='first')[源代码]#

表示重复的系列值。

重复的值表示为 True 结果系列中的值。可以指示所有副本、除第一个副本之外的所有副本或除最后一个出现的副本之外的所有副本。

参数

keep{‘First’，‘Last’，False}，默认为‘First’

处理删除重复项的方法：

‘First’：标记为 True 除了第一次出现的情况。
‘last’：标记为重复 True 除了最后一次出现。
False ：将所有重复项标记为 True 。

退货

系列 [bool]: 指示每个值是否出现在前面的值中的序列。

参见

Index.duplicated: Pandas.Index上的等效方法。
DataFrame.duplicated: Pandas.DataFrame上的等效方法。
Series.drop_duplicates: 从系列中删除重复值。

示例

默认情况下，对于每组重复的值，第一个匹配项设置为False，所有其他匹配项设置为True：

>>> animals = pd.Series(['lama', 'cow', 'lama', 'beetle', 'lama'])
>>> animals.duplicated()
0    False
1    False
2     True
3    False
4     True
dtype: bool

这相当于

>>> animals.duplicated(keep='first')
  False
  False
   True
  False
   True
dtype: bool

通过使用‘last’，每组重复值的最后一次出现被设置为False，所有其他值被设置为True：

>>> animals.duplicated(keep='last')
   True
  False
   True
  False
  False
dtype: bool

通过将Keep设置为打开 False ，所有副本均为True：

>>> animals.duplicated(keep=False)
   True
  False
   True
  False
   True
dtype: bool

pandas.Series.dropna

pandas.Series.eq