pandas.arrays.SparseArray#
- class pandas.arrays.SparseArray(data, sparse_index=None, index=None, fill_value=None, kind='integer', dtype=None, copy=False)[源代码]#
用于存储稀疏数据的Extension数组。
- 参数
- data类数组或标量
要存储在Sparse数组中的密集值数组。这可能包含 fill_value 。
- sparse_indexSparseIndex,可选
- index索引
1.4.0 版后已移除: 使用如下函数 np.full 来构造具有所需标量值重复的数组。
- fill_value标量,可选
数据中的元素是
fill_value
不存储在Sparse数组中。为了节省内存,这应该是 data 。默认情况下, fill_value 取决于的数据类型 data :data.dtype
na_value
浮动
np.nan
集成
0
布尔尔
错误
日期时间64
pd.NaT
时间增量64
pd.NaT
填充值可能以三种方式指定。按照优先顺序,这些是
这个 fill_value 论据
dtype.fill_value
if fill_value is None and dtype is aSparseDtype
data.dtype.fill_value
如果 fill_value 为None且 dtype 不是一个SparseDtype
和 data 是一种SparseArray
。
- kind应力
可以是‘INTEGER’或‘BLOCK’,默认为‘INTEGER’。稀疏位置的存储类型。
“Block”:存储一个 block 和 block_length 对于每个连续的 span 稀疏值。当稀疏数据倾向于聚集在一起时,这是最好的,其中有大区域
fill-value
稀疏值之间的值。‘INTEGER’:使用一个整数存储每个稀疏值的位置。
- dtypeNp.dtype或SparseDtype,可选
要用于Sparse数组的数据类型。对于NumPy数据类型,这决定了
self.sp_values
。对于SparseDtype,这决定了self.sp_values
和self.fill_value
。- copy布尔值,默认为False
是否显式复制传入的 data 数组。
示例
>>> from pandas.arrays import SparseArray >>> arr = SparseArray([0, 0, 1, 2]) >>> arr [0, 0, 1, 2] Fill: 0 IntIndex Indices: array([2, 3], dtype=int32)
属性
None
方法:
None