PANDA数组、标量和数据类型#
客体#
对于大多数数据类型,Pandas使用NumPy数组作为包含在 Index
, Series
,或 DataFrame
。
对于某些数据类型,Pandas扩展了NumPy的类型系统。可在以下位置找到这些类型的字符串别名 数据类型 。
数据类型 |
Pandas数据类型 |
标量 |
阵列 |
---|---|---|---|
TZ感知的DateTime |
|||
Timedeltas |
(无) |
||
期间(时间跨度) |
|||
间隔时间 |
|||
可为空的整数 |
|
(无) |
|
直截了当的 |
(无) |
||
稀疏 |
(无) |
||
字符串 |
|||
布尔型(带NA) |
Pandas和第三方库可以扩展NumPy的类型系统(请参见 扩展类型 )。最高层 array()
方法可用于创建新数组,该数组可存储在 Series
, Index
,或作为 DataFrame
。
|
创建一个阵列。 |
日期时间#
NumPy不能本机表示时区感知的日期时间。Pandas支持这一点, arrays.DatetimeArray
扩展数组,它可以保存时区朴素或时区感知的值。
Timestamp
,是的子类 datetime.datetime
,是Pandas的标量类型,用于时区朴素或时区感知的日期时间数据。
|
PANDA替换了PYTHON DATETIME.DATETIME对象。 |
属性#
返回NumPy DateTime64格式,单位为纳秒。 |
|
一周中的返回日。 |
|
一周中的返回日。 |
|
返回一年中的某一天。 |
|
返回一年中的某一天。 |
|
返回该月的天数。 |
|
返回该月的天数。 |
|
如果年份是闰年,则返回True。 |
|
如果Date是每月的最后一天,则返回True。 |
|
如果Date是每月的第一天,则返回True。 |
|
如果日期是季度的最后一天,则返回True。 |
|
如果Date是季度的第一天,则返回True。 |
|
如果Date是一年的最后一天,则返回True。 |
|
如果Date是一年的第一天,则返回True。 |
|
返回一年中的季度。 |
|
Tzinfo的别名。 |
|
返回一年中的第几周。 |
|
返回一年中的第几周。 |
|
方法:#
|
将支持时区的时间戳转换为另一个时区。 |
|
返回一个新的时间戳,该时间戳与此解析相同。 |
|
将日期、时间合并为具有相同日期和时间字段的日期时间。 |
返回ctime()样式字符串。 |
|
返回年、月、日相同的日期对象。 |
|
返回指定地区的时间戳的日期名称。 |
|
返回self.tzinfo.dst(Self)。 |
|
|
返回一个新的时间戳,该时间戳已覆盖到此分辨率。 |
返回该月的总天数。 |
|
|
传递一个序数,将其翻译并转换为T。 |
|
转换时间戳 [, tz] 从POSIX时间戳转换为TZ的本地时间。 |
返回包含ISO年、周号和工作日的命名元组。 |
|
返回根据ISO 8610格式化的时间。 |
|
返回由该日期表示的星期几。 |
|
返回指定地区的时间戳的月份名称。 |
|
将时间戳标准化为午夜,保留tz信息。 |
|
|
返回新的Timestamp对象,表示tz本地的当前时间。 |
|
实现日期时间。替换,处理纳秒。 |
|
将时间戳四舍五入为指定的分辨率。 |
|
返回一个字符串,该字符串表示由显式格式字符串控制的给定POSIX时间戳。 |
|
功能未实现。 |
返回时间相同但tzinfo=None的Time对象。 |
|
以浮点形式返回POSIX时间戳。 |
|
返回时间元组,与time.localtime()兼容。 |
|
返回具有相同时间和tzinfo的Time对象。 |
|
返回一个精度为‘ns’的numpy.datetime64对象。 |
|
将时间戳转换为NumPy日期64。 |
|
将时间戳转换为儒略日期。 |
|
返回此时间戳为其观察值的时段。 |
|
将时间戳对象转换为本机Python DateTime对象。 |
|
|
返回本地时区中的当前时间。 |
返回服用安慰剂的格里高利序号。 |
|
|
将支持时区的时间戳转换为另一个时区。 |
|
将原始时间戳转换为本地时区,或从支持时区的时间戳中删除时区。 |
返回self.tzinfo.tzname(Self)。 |
|
从POSIX时间戳构造一个简单的UTC日期时间。 |
|
|
返回表示UTC日期和时间的新时间戳。 |
返回self.tzinfo.utcofset(Self)。 |
|
返回UTC时间元组,与time.localtime()兼容。 |
|
返回由该日期表示的星期几。 |
时间戳的集合可以存储在 arrays.DatetimeArray
。对于支持时区的数据, .dtype
属于 arrays.DatetimeArray
是一种 DatetimeTZDtype
。对于时区原始数据, np.dtype("datetime64[ns]")
是使用的。
如果数据支持时区,则数组中的每个值必须具有相同的时区。
|
Pandas Extension数组,用于Tz-naive或Tz-Aware日期时间数据。 |
|
支持时区的DateTime数据的ExtensionDtype。 |
Timedeltas#
NumPy本身可以表示时间增量。Pandas提供了 Timedelta
对于对称,请使用 Timestamp
。
|
表示持续时间,即两个日期或时间之间的差值。 |
属性#
返回一个NumPy的timedelta64数组标量视图。 |
|
返回一个名为类似元组的组件。 |
|
天数。 |
|
返回时间增量,单位为纳秒(Ns),用于内部兼容。 |
|
微秒数(>=0且小于1秒)。 |
|
返回纳秒数(N),其中0<=n<1微秒。 |
|
秒数(>=0且小于1天)。 |
|
阵列视图兼容性。 |
方法:#
|
返回一个新的Timedelta,割让给这个决议。 |
|
返回一个新的Timedelta失败了这个决议。 |
将Timedelta格式设置为ISO 8601持续时间,如 |
|
|
将Timedelta舍入到指定的分辨率。 |
将PandasTimedelta对象转换为 Python |
|
返回一个精度为‘ns’的numpy.timedelta64对象。 |
|
将Timedelta转换为NumPy timedelta64。 |
|
持续时间内的总秒数。 |
一系列 Timedelta
可以存储在 TimedeltaArray
。
|
时间增量数据的Pandas扩展数组。 |
周期#
Pandas代表着跨越时代的 Period
对象。
期间#
|
表示一段时间。 |
属性#
得到一个经期所在月份的第几天。 |
|
周期所在的星期几,星期一=0,星期日=6。 |
|
周期所在的星期几,星期一=0,星期日=6。 |
|
返回一年中的某一天。 |
|
返回一年中的某一天。 |
|
获取此期间所在月份的总天数。 |
|
获取该期间所在月份的总天数。 |
|
获取时段结束的时间戳。 |
|
返回频率的字符串表示形式。 |
|
获取该期间的一天中的小时部分。 |
|
如果该期间的年份在闰年,则返回True。 |
|
获取时段中小时部分的分钟数。 |
|
返回此期间所在的月份。 |
|
返回此期间所在的季度。 |
|
财政年度根据其开始季度,该期间所在的时间段。 |
|
获取该期间的第二个组成部分。 |
|
获取时段开始的时间戳。 |
|
获取给定时间段的一年中的第几周。 |
|
周期所在的星期几,星期一=0,星期日=6。 |
|
获取给定时间段的一年中的第几周。 |
|
返回此期间所属的年份。 |
方法:#
在间隔开始或结束时,将周期转换为所需频率。 |
|
返回当前日期的期间。 |
|
属性的字符串表示形式。 |
|
返回该期间的时间戳表示形式。 |
一系列 Period
可以存储在 arrays.PeriodArray
。一年中的每一个句点 arrays.PeriodArray
必须有相同的 freq
。
|
用于存储周期数据的Pandas Extension数组。 |
|
期间数据的ExtensionDtype。 |
间隔时间#
任意间隔可以表示为 Interval
对象。
实现区间的不可变对象,区间是有界的类似切片的区间。 |
属性#
间隔是左侧闭合、右侧闭合、两者都闭合还是两者都不闭合。 |
|
检查左侧的间隔是否闭合。 |
|
检查右侧的间隔是否闭合。 |
|
指示间隔是否为空,表示该间隔不包含任何点。 |
|
中场休息时的左路。 |
|
返回间隔的长度。 |
|
返回间隔的中点。 |
|
检查左侧的间隔是否打开。 |
|
检查右侧的间隔是否打开。 |
|
检查两个间隔对象是否重叠。 |
|
中场休息时的右界。 |
间隔的集合可以存储在 arrays.IntervalArray
。
|
同侧闭合的间隔数据的Pandas数组。 |
|
间隔数据的ExtensionDtype。 |
可为空的整数#
numpy.ndarray
无法本机表示缺少值的整型数据。Pandas通过以下途径提供这一点 arrays.IntegerArray
。
|
整型(可选缺失)值的数组。 |
|
用于int8整数数据的ExtensionDtype。 |
|
用于int16整数数据的ExtensionDtype。 |
|
用于int32整数数据的ExtensionDtype。 |
|
用于int64整数数据的ExtensionDtype。 |
|
Uint8整数数据的ExtensionDtype。 |
|
Uint16整数数据的ExtensionDtype。 |
|
Uint32整数数据的ExtensionDtype。 |
|
Uint64整数数据的ExtensionDtype。 |
类别词#
Pandas定义了一种自定义数据类型,用于表示只能接受一组有限的固定值的数据。的数据类型。 Categorical
可以用一个 CategoricalDtype
。
|
键入类别和顺序的分类数据。 |
一个 |
|
类别是否具有有序关系。 |
分类数据可以存储在 pandas.Categorical
|
以经典的R/S+方式表示一个分类变量。 |
另一个选择 Categorical.from_codes()
当您已经有了类别和整数代码时,可以使用构造函数:
|
根据代码和类别或数据类型制作分类类型。 |
数据类型信息可在 Categorical
这个 |
|
这个定语的范畴。 |
|
类别是否具有有序关系。 |
|
这一分类的类别代码。 |
np.asarray(categorical)
通过实现数组接口来工作。请注意,这会将 Categorical
返回到NumPy数组,因此不会保留类别和订单信息!
|
NumPy数组接口。 |
A Categorical
可以存储在 Series
或 DataFrame
。创建一系列数据类型 category
,使用 cat = s.astype(dtype)
或 Series(..., dtype=dtype)
哪里 dtype
要么是
字符串
'category'
的一个实例
CategoricalDtype
。
如果 Series
是数据类型 CategoricalDtype
, Series.cat
可用于更改分类数据。看见 范畴存取器 想要更多。
稀疏#
单一值重复多次的数据(例如 0
或 NaN
)可以高效地存储为 arrays.SparseArray
。
|
用于存储稀疏数据的Extension数组。 |
|
存储在中的数据的数据类型 |
这个 Series.sparse
访问器可用于访问稀疏特定的属性和方法,如果 Series
包含稀疏值。看见 稀疏访问器 和 the user guide 想要更多。
字符串#
在处理文本数据时,如果每个有效元素都是字符串或缺失,我们建议使用 StringDtype
(使用别名 "string"
)。
|
字符串数据的扩展数组。 |
中的字符串数据的扩展数组 |
|
字符串数据的扩展数据类型。 |
这个 Series.str
访问器可用于 Series
背后有一个 arrays.StringArray
。看见 字符串处理 想要更多。
可为空的布尔值#
布尔数据类型(具有别名 "boolean"
)提供对存储布尔数据的支持 (True
, False
),这对于布尔值是不可能的 numpy.ndarray
。
|
缺少值的布尔(True/False)数据数组。 |
|
布尔数据的扩展数据类型。 |
公用事业#
构造函数#
|
将类似分类的联合类别的列表组合在一起。 |
有效地推断传递的val或列表型值数组的类型。 |
|
|
将输入转换为仅Pandas数据类型对象或数字数据类型对象。 |
数据类型自检#
|
检查提供的数组或数据类型是否为布尔数据类型。 |
|
检查类似数组的数据类型或数据类型是否属于分类数据类型。 |
|
检查提供的数组或数据类型是否为复杂数据类型。 |
|
检查提供的数组或数据类型是否为日期64数据类型。 |
|
检查类似数组的类型或数据类型是否为DateTime64数据类型。 |
|
检查提供的数组或数据类型是否为DateTime64 [ns] 数据类型。 |
|
检查类似数组或数据类型是否为DatetimeTZDtype数据类型。 |
|
(已弃用)检查类似数组的对象是否属于Pandas扩展类实例。 |
|
检查对象是否为Pandas扩展数组类型。 |
|
检查提供的数组或数据类型是否为浮点数据类型。 |
|
检查提供的数组或数据类型是否为int64 dtype。 |
|
检查提供的数组或数据类型是否为整数数据类型。 |
|
检查类似数组的类型或数据类型是否为间隔数据类型。 |
|
检查提供的数组或数据类型是否为数字数据类型。 |
|
检查类似数组或数据类型是否属于对象数据类型。 |
|
检查类似数组的类型或数据类型是否属于句点dtype。 |
|
检查提供的数组或数据类型是否为带符号整数数据类型。 |
|
检查提供的数组或数据类型是否为字符串数据类型。 |
|
检查类似数组或数据类型是否为timedelta64数据类型。 |
|
检查提供的数组或数据类型是否为timedelta64 [ns] 数据类型。 |
|
检查提供的数组或数据类型是否为无符号整数数据类型。 |
|
检查类似数组的是否为一维Pandas稀疏数组。 |
可重复的内省#
|
检查对象是否与字典相似。 |
|
检查对象是否为类似文件的对象。 |
检查对象是否类似于列表。 |
|
|
检查对象是否为命名元组。 |
检查对象是否为迭代器。 |
标量自省#
如果给定对象为布尔值,则返回True。 |
|
|
检查类似数组的对象是否是类别实例。 |
如果给定对象是复杂的,则返回True。 |
|
如果给定对象为Float,则返回True。 |
|
|
如果hash(Obj)成功,则返回True,否则返回False。 |
如果给定对象为整数,则返回True。 |
|
|
检查对象是否为数字。 |
|
检查对象是否为正则表达式模式实例。 |
|
检查对象是否可以编译成正则表达式模式实例。 |
如果给定对象是标量对象,则返回True。 |