pandas.arrays.SparseArray#

class pandas.arrays.SparseArray(data, sparse_index=None, index=None, fill_value=None, kind='integer', dtype=None, copy=False)[源代码]#

用于存储稀疏数据的Extension数组。

参数

data类数组或标量

要存储在Sparse数组中的密集值数组。这可能包含 fill_value 。

sparse_indexSparseIndex，可选

index索引

1.4.0 版后已移除: 使用如下函数 np.full 来构造具有所需标量值重复的数组。

fill_value标量，可选

数据中的元素是 fill_value 不存储在Sparse数组中。为了节省内存，这应该是 data 。默认情况下， fill_value 取决于的数据类型 data ：

data.dtype	na_value
浮动	`np.nan`
集成	`0`
布尔尔	错误
日期时间64	`pd.NaT`
时间增量64	`pd.NaT`

填充值可能以三种方式指定。按照优先顺序，这些是

这个 fill_value 论据
dtype.fill_value if fill_value is None and dtype is a SparseDtype
data.dtype.fill_value 如果 fill_value 为None且 dtype 不是一个 SparseDtype 和 data 是一种 SparseArray 。

kind应力

可以是‘INTEGER’或‘BLOCK’，默认为‘INTEGER’。稀疏位置的存储类型。

“Block”：存储一个 block 和 block_length 对于每个连续的 span 稀疏值。当稀疏数据倾向于聚集在一起时，这是最好的，其中有大区域 fill-value 稀疏值之间的值。
‘INTEGER’：使用一个整数存储每个稀疏值的位置。

dtypeNp.dtype或SparseDtype，可选

要用于Sparse数组的数据类型。对于NumPy数据类型，这决定了 self.sp_values 。对于SparseDtype，这决定了 self.sp_values 和 self.fill_value 。

copy布尔值，默认为False

是否显式复制传入的 data 数组。

示例

>>> from pandas.arrays import SparseArray
>>> arr = SparseArray([0, 0, 1, 2])
>>> arr
[0, 0, 1, 2]
Fill: 0
IntIndex
Indices: array([2, 3], dtype=int32)

属性

None

方法：

None

pandas.Categorical.__array__

pandas.SparseDtype