pandas.api.types.infer_dtype#
- pandas.api.types.infer_dtype()#
有效地推断传递的val或列表型值数组的类型。返回描述该类型的字符串。
- 参数
- value标量、列表、ndarray或Pandas类型
- skipna布尔值,默认为True
在推断类型时忽略NaN值。
- 退货
- 应力
描述输入数据的常见类型。
- 结果可能包括:
- 字符串
- 字节数
- 漂浮
- 整数
- 混合整数
- 混合整数浮点数
- 十进制
- 复合体
- 直截了当的
- 布尔值
- 日期时间64
- 日期时间
- 日期
- 时间增量64
- 时间增量
- 时间
- 期间
- 混合
- 未知数组
- 加薪
- TypeError
如果类似于ndarray,但无法推断数据类型
注意事项
‘MIXED’是任何非专业的东西的总称
‘MIXED-INTEGER-FLOAT’是浮点数和整数
‘MIXED-INTEGER’是整数和非整数的混合
‘UNKNOWN-ARRAY’是对某些东西的概括 is 数组(具有dtype属性),但具有Pandas未知的数据类型(例如外部扩展数组)
示例
>>> import datetime >>> infer_dtype(['foo', 'bar']) 'string'
>>> infer_dtype(['a', np.nan, 'b'], skipna=True) 'string'
>>> infer_dtype(['a', np.nan, 'b'], skipna=False) 'mixed'
>>> infer_dtype([b'foo', b'bar']) 'bytes'
>>> infer_dtype([1, 2, 3]) 'integer'
>>> infer_dtype([1, 2, 3.5]) 'mixed-integer-float'
>>> infer_dtype([1.0, 2.0, 3.5]) 'floating'
>>> infer_dtype(['a', 1]) 'mixed-integer'
>>> infer_dtype([Decimal(1), Decimal(2.0)]) 'decimal'
>>> infer_dtype([True, False]) 'boolean'
>>> infer_dtype([True, False, np.nan]) 'boolean'
>>> infer_dtype([pd.Timestamp('20130101')]) 'datetime'
>>> infer_dtype([datetime.date(2013, 1, 1)]) 'date'
>>> infer_dtype([np.datetime64('2013-01-01')]) 'datetime64'
>>> infer_dtype([datetime.timedelta(0, 1, 1)]) 'timedelta'
>>> infer_dtype(pd.Series(list('aabc')).astype('category')) 'categorical'