pandas.api.types.infer_dtype#

pandas.api.types.infer_dtype()#

有效地推断传递的val或列表型值数组的类型。返回描述该类型的字符串。

参数
value标量、列表、ndarray或Pandas类型
skipna布尔值,默认为True

在推断类型时忽略NaN值。

退货
应力

描述输入数据的常见类型。

结果可能包括:
  • 字符串
  • 字节数
  • 漂浮
  • 整数
  • 混合整数
  • 混合整数浮点数
  • 十进制
  • 复合体
  • 直截了当的
  • 布尔值
  • 日期时间64
  • 日期时间
  • 日期
  • 时间增量64
  • 时间增量
  • 时间
  • 期间
  • 混合
  • 未知数组
加薪
TypeError

如果类似于ndarray,但无法推断数据类型

注意事项

  • ‘MIXED’是任何非专业的东西的总称

  • ‘MIXED-INTEGER-FLOAT’是浮点数和整数

  • ‘MIXED-INTEGER’是整数和非整数的混合

  • ‘UNKNOWN-ARRAY’是对某些东西的概括 is 数组(具有dtype属性),但具有Pandas未知的数据类型(例如外部扩展数组)

示例

>>> import datetime
>>> infer_dtype(['foo', 'bar'])
'string'
>>> infer_dtype(['a', np.nan, 'b'], skipna=True)
'string'
>>> infer_dtype(['a', np.nan, 'b'], skipna=False)
'mixed'
>>> infer_dtype([b'foo', b'bar'])
'bytes'
>>> infer_dtype([1, 2, 3])
'integer'
>>> infer_dtype([1, 2, 3.5])
'mixed-integer-float'
>>> infer_dtype([1.0, 2.0, 3.5])
'floating'
>>> infer_dtype(['a', 1])
'mixed-integer'
>>> infer_dtype([Decimal(1), Decimal(2.0)])
'decimal'
>>> infer_dtype([True, False])
'boolean'
>>> infer_dtype([True, False, np.nan])
'boolean'
>>> infer_dtype([pd.Timestamp('20130101')])
'datetime'
>>> infer_dtype([datetime.date(2013, 1, 1)])
'date'
>>> infer_dtype([np.datetime64('2013-01-01')])
'datetime64'
>>> infer_dtype([datetime.timedelta(0, 1, 1)])
'timedelta'
>>> infer_dtype(pd.Series(list('aabc')).astype('category'))
'categorical'