一般职能#

数据操作#

melt \(框架[, id_vars, value_vars, var_name, ...] )

将DataFrame从宽格式取消透视为长格式,可以选择保留设置的标识符。

pivot \(数据[, index, columns, values] )

返回按给定索引/列值组织的整形DataFrame。

pivot_table \(数据[, values, index, columns, ...] )

将电子表格样式的数据透视表创建为DataFrame。

crosstab \(索引,列[, values, rownames, ...] )

计算两个(或更多)因素的简单交叉表。

cut \(X,垃圾箱[, right, labels, retbins, ...] )

将值存储到离散的间隔中。

qcut \(X,Q[, labels, retbins, precision, ...] )

基于分位数的离散化函数。

merge \(左、右[, how, on, left_on, ...] )

将DataFrame或命名系列对象与数据库样式联接合并。

merge_ordered \(左、右[, on, left_on, ...] )

使用可选填充/内插对有序数据执行合并。

merge_asof \(左、右[, on, left_on, ...] )

按关键点距离执行合并。

concat \(对象[, axis, join, ignore_index, ...] )

使用沿其他轴的可选设置逻辑沿特定轴连接Pandas对象。

get_dummies \(数据[, prefix, prefix_sep, ...] )

将类别变量转换为虚拟/指示变量。

factorize \(值[, sort, na_sentinel, size_hint] )

将对象编码为枚举类型或类别变量。

unique \(值)

根据哈希表返回唯一值。

wide_to_long \(df,存根名称,i,j[, sep, suffix] )

将DataFrame从宽格式取消透视为长格式。

顶级缺失数据#

isna \(OBJ)

检测类似数组的对象的缺失值。

isnull \(OBJ)

检测类似数组的对象的缺失值。

notna \(OBJ)

检测类似数组的对象的非缺失值。

notnull \(OBJ)

检测类似数组的对象的非缺失值。

顶层处理数字数据#

to_numeric \(参数[, errors, downcast] )

将参数转换为数值类型。

顶级处理类似日期时间的数据#

to_datetime \(参数[, errors, dayfirst, ...] )

将参数转换为日期时间。

to_timedelta \(参数[, unit, errors] )

将参数转换为时间增量。

date_range \([start, end, periods, freq, tz, ...] )

返回固定频率的DatetimeIndex。

bdate_range \([start, end, periods, freq, tz, ...] )

返回固定频率的DatetimeIndex,默认频率为工作日。

period_range \([start, end, periods, freq, name] )

返回固定频率的周期索引。

timedelta_range \([start, end, periods, freq, ...] )

返回固定频率的TimedeltaIndex,默认频率为day。

infer_freq \(索引[, warn] )

在给定输入指数的情况下推断最可能的频率。

顶层处理区间数据#

interval_range \([start, end, periods, freq, ...] )

返回固定频率的IntervalIndex。

顶层评估#

eval \(表达式[, parser, engine, truediv, ...] )

使用各种后端将Python表达式作为字符串进行求值。

散列#

util.hash_array \(VALS [, encoding, hash_key, ...] )

给定一个一维数组,返回一个确定性整数数组。

util.hash_pandas_object \(OBJ[, index, ...] )

返回Index/Series/DataFrame的数据哈希。