DataFrame#

构造器#

DataFrame \([data, index, columns, dtype, copy] )

二维、大小可变、可能是异类的表格数据。

属性和基础数据#

Axes

DataFrame.index 

DataFrame的索引(行标签)。

DataFrame.columns 

DataFrame的列标签。

DataFrame.dtypes 

返回DataFrame中的数据类型。

DataFrame.info \([verbose, buf, max_cols, ...] )

打印DataFrame的简明摘要。

DataFrame.select_dtypes \([include, exclude] )

根据列数据类型返回DataFrame的列的子集。

DataFrame.values 

返回DataFrame的Numpy表示形式。

DataFrame.axes 

返回表示DataFrame轴的列表。

DataFrame.ndim 

返回一个整数,表示轴/数组的维数。

DataFrame.size 

返回一个int,表示此对象中的元素数。

DataFrame.shape 

返回表示DataFrame的维度的元组。

DataFrame.memory_usage \([index, deep] )

以字节为单位返回每列的内存使用情况。

DataFrame.empty 

指示Series/DataFrame是否为空。

DataFrame.set_flags \(*[, copy, ...] )

返回一个具有更新标志的新对象。

转换#

DataFrame.astype \(dtype[, copy, errors] )

将Pandas对象强制转换为指定的dtype dtype

DataFrame.convert_dtypes \([infer_objects, ...] )

使用支持的数据类型将列转换为最佳数据类型 pd.NA

DataFrame.infer_objects \()

尝试为对象列推断更好的数据类型。

DataFrame.copy \([deep] )

复制此对象的索引和数据。

DataFrame.bool \()

返回单个元素Series或DataFrame的布尔值。

索引、迭代#

DataFrame.head \([n] )

返回第一个 n 排好了。

DataFrame.at 

访问行/列标签对的单个值。

DataFrame.iat 

按整数位置访问行/列对的单个值。

DataFrame.loc 

通过标签或布尔数组访问一组行和列。

DataFrame.iloc 

纯粹基于整数位置的索引,用于按位置选择。

DataFrame.insert \(位置,列,值[, ...] )

在DataFrame中的指定位置插入列。

DataFrame.__iter__ \()

在信息轴上迭代。

DataFrame.items \()

迭代(列名,系列)对。

DataFrame.iteritems \()

迭代(列名,系列)对。

DataFrame.keys \()

获取‘INFO轴’(参见索引了解更多信息)。

DataFrame.iterrows \()

将DataFrame行作为(索引,系列)对进行迭代。

DataFrame.itertuples \([index, name] )

将DataFrame行作为命名元组进行迭代。

DataFrame.lookup \(行_标签,列_标签)

(已弃用)DataFrame的基于标签的“奇特索引”函数。

DataFrame.pop \(项目)

返回项目并从框架中删除。

DataFrame.tail \([n] )

退还最后一张 n 排好了。

DataFrame.xs \(密钥[, axis, level, drop_level] )

从系列/数据帧返回横截面。

DataFrame.get \(密钥[, default] )

从给定键的对象中获取项(例如:DataFrame列)。

DataFrame.isin \(值)

DataFrame中的每个元素是否包含在值中。

DataFrame.where \(条件[, other, inplace, ...] )

替换条件为FALSE的值。

DataFrame.mask \(条件[, other, inplace, axis, ...] )

替换条件为True的值。

DataFrame.query \(表达式[, inplace] )

使用布尔表达式查询DataFrame的列。

有关以下内容的更多信息: .at.iat.loc ,以及 .iloc ,请参阅 indexing documentation

二元算子函数#

DataFrame.add \(其他[, axis, level, fill_value] )

按元素(二元运算符)获取数据帧和其他元素的相加 add )。

DataFrame.sub \(其他[, axis, level, fill_value] )

获取数据帧和其他元素的减法(二元运算符 sub )。

DataFrame.mul \(其他[, axis, level, fill_value] )

获得数据帧和其他元素的乘法(二元运算符 mul )。

DataFrame.div \(其他[, axis, level, fill_value] )

按元素(二元运算符)获取数据帧和其他数据的浮点除法 truediv )。

DataFrame.truediv \(其他[, axis, level, ...] )

按元素(二元运算符)获取数据帧和其他数据的浮点除法 truediv )。

DataFrame.floordiv \(其他[, axis, level, ...] )

按元素(二元运算符)获取数据帧和其他数据的整数除法 floordiv )。

DataFrame.mod \(其他[, axis, level, fill_value] )

获取数据帧和其他元素的模数(二元运算符 mod )。

DataFrame.pow \(其他[, axis, level, fill_value] )

获得数据帧和其他元素的指数幂(二元运算符 pow )。

DataFrame.dot \(其他)

计算DataFrame和其他元素之间的矩阵乘法。

DataFrame.radd \(其他[, axis, level, fill_value] )

按元素(二元运算符)获取数据帧和其他元素的相加 radd )。

DataFrame.rsub \(其他[, axis, level, fill_value] )

获取数据帧和其他元素的减法(二元运算符 rsub )。

DataFrame.rmul \(其他[, axis, level, fill_value] )

获得数据帧和其他元素的乘法(二元运算符 rmul )。

DataFrame.rdiv \(其他[, axis, level, fill_value] )

按元素(二元运算符)获取数据帧和其他数据的浮点除法 rtruediv )。

DataFrame.rtruediv \(其他[, axis, level, ...] )

按元素(二元运算符)获取数据帧和其他数据的浮点除法 rtruediv )。

DataFrame.rfloordiv \(其他[, axis, level, ...] )

按元素(二元运算符)获取数据帧和其他数据的整数除法 rfloordiv )。

DataFrame.rmod \(其他[, axis, level, fill_value] )

获取数据帧和其他元素的模数(二元运算符 rmod )。

DataFrame.rpow \(其他[, axis, level, fill_value] )

获得数据帧和其他元素的指数幂(二元运算符 rpow )。

DataFrame.lt \(其他[, axis, level] )

获取小于数据帧和其他元素(二元运算符 lt )。

DataFrame.gt \(其他[, axis, level] )

获取数据帧和其他元素的大于(二元运算符 gt )。

DataFrame.le \(其他[, axis, level] )

按元素(二元运算符)获取小于或等于的数据帧和其他 le )。

DataFrame.ge \(其他[, axis, level] )

获取大于或等于数据帧和其他元素(二元运算符 ge )。

DataFrame.ne \(其他[, axis, level] )

Get Not等于of DataFrame and Other,以元素为单位(二元运算符 ne )。

DataFrame.eq \(其他[, axis, level] )

按元素(二元运算符)获取数据帧和其他的等于 eq )。

DataFrame.combine \(其他、函数 [, fill_value, ...] )

与另一个DataFrame执行列合并。

DataFrame.combine_first \(其他)

使用中相同位置的值更新空元素 other

函数应用程序,分组依据窗口(&W)#

DataFrame.apply \(函数[, axis, raw, ...] )

沿DataFrame的轴应用函数。

DataFrame.applymap \(函数[, na_action] )

以元素方式将函数应用于数据帧。

DataFrame.pipe \(函数,*args, * *kwargs)

应用预期为Series或DataFrame的可链接函数。

DataFrame.agg \([func, axis] )

使用指定轴上的一个或多个操作进行聚合。

DataFrame.aggregate \([func, axis] )

使用指定轴上的一个或多个操作进行聚合。

DataFrame.transform \(函数[, axis] )

打电话 func 关于Self生成与Self具有相同轴形状的DataFrame。

DataFrame.groupby \([by, axis, level, ...] )

使用映射器或按一系列列对DataFrame进行分组。

DataFrame.rolling \(窗口[, min_periods, ...] )

提供滚动窗口计算。

DataFrame.expanding \([min_periods, center, ...] )

提供扩展窗口计算。

DataFrame.ewm \([com, span, halflife, alpha, ...] )

提供指数加权(EW)计算。

计算/描述性统计#

DataFrame.abs \()

返回一个具有每个元素的绝对数值的Series/DataFrame。

DataFrame.all \([axis, bool_only, skipna, level] )

返回是否所有元素都为True,可能是在某个轴上。

DataFrame.any \([axis, bool_only, skipna, level] )

返回是否有任何元素为True,可能是在轴上。

DataFrame.clip \([lower, upper, axis, inplace] )

修剪输入阈值上的值。

DataFrame.corr \([method, min_periods, ...] )

计算列的成对关联,不包括NA/NULL值。

DataFrame.corrwith \(其他[, axis, drop, ...] )

计算成对相关。

DataFrame.count \([axis, level, numeric_only] )

对每列或每行的非NA单元格进行计数。

DataFrame.cov \([min_periods, ddof, numeric_only] )

计算列的成对协方差,不包括NA/NULL值。

DataFrame.cummax \([axis, skipna] )

返回DataFrame或Series轴上的累计最大值。

DataFrame.cummin \([axis, skipna] )

返回DataFrame或Series轴上的累计最小值。

DataFrame.cumprod \([axis, skipna] )

返回DataFrame或Series轴上的累计积。

DataFrame.cumsum \([axis, skipna] )

返回DataFrame或Series轴上的累计和。

DataFrame.describe \([percentiles, include, ...] )

生成描述性统计数据。

DataFrame.diff \([periods, axis] )

单元的一阶离散差分。

DataFrame.eval \(表达式[, inplace] )

计算描述DataFrame列上的操作的字符串。

DataFrame.kurt \([axis, skipna, level, ...] )

返回请求的轴上的无偏峰度。

DataFrame.kurtosis \([axis, skipna, level, ...] )

返回请求的轴上的无偏峰度。

DataFrame.mad \([axis, skipna, level] )

(已弃用)返回值在请求的轴上的平均绝对偏差。

DataFrame.max \([axis, skipna, level, ...] )

返回请求的轴上的最大值。

DataFrame.mean \([axis, skipna, level, ...] )

返回请求的轴上的值的平均值。

DataFrame.median \([axis, skipna, level, ...] )

返回值在请求的轴上的中位数。

DataFrame.min \([axis, skipna, level, ...] )

返回请求的轴上的最小值。

DataFrame.mode \([axis, numeric_only, dropna] )

获取沿所选轴的每个元素的模式。

DataFrame.pct_change \([periods, fill_method, ...] )

当前元素和前一个元素之间的百分比变化。

DataFrame.prod \([axis, skipna, level, ...] )

返回值在请求的轴上的乘积。

DataFrame.product \([axis, skipna, level, ...] )

返回值在请求的轴上的乘积。

DataFrame.quantile \([q, axis, numeric_only, ...] )

在请求的轴上返回给定分位数的值。

DataFrame.rank \([axis, method, numeric_only, ...] )

沿轴计算数值数据排名(从1到n)。

DataFrame.round \([decimals] )

将DataFrame四舍五入到小数位数可变。

DataFrame.sem \([axis, skipna, level, ddof, ...] )

返回请求轴上平均值的无偏标准误差。

DataFrame.skew \([axis, skipna, level, ...] )

返回请求的轴上的无偏斜。

DataFrame.sum \([axis, skipna, level, ...] )

返回请求的轴上的值的总和。

DataFrame.std \([axis, skipna, level, ddof, ...] )

返回要求轴上的样本标准偏差。

DataFrame.var \([axis, skipna, level, ddof, ...] )

返回请求的轴上的无偏差。

DataFrame.nunique \([axis, dropna] )

计算指定轴上的不同元素的数量。

DataFrame.value_counts \([subset, normalize, ...] )

返回包含DataFrame中唯一行计数的Series。

重建索引/选择/标签操作#

DataFrame.add_prefix \(前缀)

使用字符串为标签添加前缀 prefix

DataFrame.add_suffix \(后缀)

使用字符串为标签添加后缀 suffix

DataFrame.align \(其他[, join, axis, level, ...] )

将两个对象的轴向与指定的联接方法对齐。

DataFrame.at_time \(时间[, asof, axis] )

选择一天中特定时间(例如上午9:30)的值。

DataFrame.between_time \(开始时间_时间,结束时间)

选择一天中特定时间(例如,上午9:00-9:30)之间的值。

DataFrame.drop \([labels, axis, index, ...] )

从行或列中删除指定的标签。

DataFrame.drop_duplicates \([subset, keep, ...] )

返回删除了重复行的DataFrame。

DataFrame.duplicated \([subset, keep] )

返回表示重复行的布尔系列。

DataFrame.equals \(其他)

测试两个对象是否包含相同的元素。

DataFrame.filter \([items, like, regex, axis] )

根据指定的索引标签子集数据帧的行或列。

DataFrame.first \(偏移)

根据日期偏移量选择时间序列数据的初始期间。

DataFrame.head \([n] )

返回第一个 n 排好了。

DataFrame.idxmax \([axis, skipna] )

返回在请求的轴上第一次出现最大值的索引。

DataFrame.idxmin \([axis, skipna] )

返回在请求的轴上第一次出现最小值的索引。

DataFrame.last \(偏移)

根据日期偏移量选择时间序列数据的最终期间。

DataFrame.reindex \([labels, index, columns, ...] )

使Series/DataFrame符合具有可选填充逻辑的新索引。

DataFrame.reindex_like \(其他[, method, ...] )

将索引匹配的对象作为其他对象返回。

DataFrame.rename \([mapper, index, columns, ...] )

更改轴标签。

DataFrame.rename_axis \([mapper, index, ...] )

设置索引或列的轴的名称。

DataFrame.reset_index \([level, drop, ...] )

重置索引或其级别。

DataFrame.sample \([n, frac, replace, ...] )

从对象轴返回项目的随机样本。

DataFrame.set_axis \(标签[, axis, inplace] )

将所需的索引指定给给定轴。

DataFrame.set_index \(密钥[, drop, append, ...] )

使用现有列设置DataFrame索引。

DataFrame.tail \([n] )

退还最后一张 n 排好了。

DataFrame.take \(索引[, axis, is_copy] )

返回给定元素中的元素 位置 沿轴的索引。

DataFrame.truncate \([before, after, axis, copy] )

在某些索引值之前和之后截断Series或DataFrame。

缺少数据处理#

DataFrame.backfill \([axis, inplace, limit, ...] )

的同义词 DataFrame.fillna() 使用 method='bfill'

DataFrame.bfill \([axis, inplace, limit, downcast] )

的同义词 DataFrame.fillna() 使用 method='bfill'

DataFrame.dropna \([axis, how, thresh, ...] )

删除缺少的值。

DataFrame.ffill \([axis, inplace, limit, downcast] )

的同义词 DataFrame.fillna() 使用 method='ffill'

DataFrame.fillna \([value, method, axis, ...] )

使用指定的方法填充NA/NaN值。

DataFrame.interpolate \([method, axis, limit, ...] )

使用插值法填充NaN值。

DataFrame.isna \()

检测缺少的值。

DataFrame.isnull \()

DataFrame.isull是DataFrame.isna的别名。

DataFrame.notna \()

检测现有(非缺失)值。

DataFrame.notnull \()

DataFrame.notull是DataFrame.notna的别名。

DataFrame.pad \([axis, inplace, limit, downcast] )

的同义词 DataFrame.fillna() 使用 method='ffill'

DataFrame.replace \([to_replace, value, ...] )

替换中给出的值 to_replace 使用 value

重塑、排序、调换#

DataFrame.droplevel \(级别[, axis] )

返回删除了请求的索引/列级别的Series/DataFrame。

DataFrame.pivot \([index, columns, values] )

返回按给定索引/列值组织的整形DataFrame。

DataFrame.pivot_table \([values, index, ...] )

将电子表格样式的数据透视表创建为DataFrame。

DataFrame.reorder_levels \(订单[, axis] )

使用输入顺序重新排列索引级别。

DataFrame.sort_values \(由[, axis, ascending, ...] )

按任一轴上的值排序。

DataFrame.sort_index \([axis, level, ...] )

按标签(沿轴)对对象进行排序。

DataFrame.nlargest \(n,列[, keep] )

返回第一个 n 行排序依据 columns 按降序排列。

DataFrame.nsmallest \(n,列[, keep] )

返回第一个 n 行排序依据 columns 按升序排列。

DataFrame.swaplevel \([i, j, axis] )

中交换级别i和j。 MultiIndex

DataFrame.stack \([level, dropna] )

从列到索引堆叠规定的级别。

DataFrame.unstack \([level, fill_value] )

透视一级(必须是分层的)索引标签。

DataFrame.swapaxes \(axis1、axis2[, copy] )

适当地互换轴和交换值轴。

DataFrame.melt \([id_vars, value_vars, ...] )

将DataFrame从宽格式取消透视为长格式,可以选择保留设置的标识符。

DataFrame.explode \(列[, ignore_index] )

将类似列表的每个元素转换为行,复制索引值。

DataFrame.squeeze \([axis] )

将1维轴对象压缩为标量。

DataFrame.to_xarray \()

从Pandas对象返回一个XARRAY对象。

DataFrame.T 

DataFrame.transpose \(*参数[, copy] )

转置索引和列。

合并/比较/合并/合并#

DataFrame.append \(其他[, ignore_index, ...] )

(已弃用)追加的行 other 到调用者的末尾,返回一个新对象。

DataFrame.assign \(** Kwargs)

将新列分配给DataFrame。

DataFrame.compare \(其他[, align_axis, ...] )

与另一个DataFrame进行比较并显示差异。

DataFrame.join \(其他[, on, how, lsuffix, ...] )

联接另一个DataFrame的列。

DataFrame.merge \(右[, how, on, left_on, ...] )

将DataFrame或命名系列对象与数据库样式联接合并。

DataFrame.update \(其他[, join, overwrite, ...] )

使用来自另一个DataFrame的非NA值就地修改。

旗子#

标志是指Pandas对象的属性。数据集的属性(如记录的日期、从中访问它的URL等)应存储在 DataFrame.attrs

Flags \(OBJ,*,允许_复制_标签)

适用于Pandas对象的标志。

元数据#

DataFrame.attrs 是用于存储此DataFrame的全局元数据的字典。

警告

DataFrame.attrs 被认为是试验性的,可能会在没有警告的情况下发生变化。

DataFrame.attrs 

此数据集的全局属性的字典。

标绘#

DataFrame.plot 是表单的特定绘图方法的可调用方法和命名空间属性 DataFrame.plot.<kind>

DataFrame.plot \([x, y, kind, ax, ....] )

数据帧绘制访问器和方法

DataFrame.plot.area \([x, y] )

绘制堆叠面积图。

DataFrame.plot.bar \([x, y] )

垂直条形图。

DataFrame.plot.barh \([x, y] )

绘制水平条形图。

DataFrame.plot.box \([by] )

制作DataFrame列的框图。

DataFrame.plot.density \([bw_method, ind] )

使用高斯核生成核密度估计图。

DataFrame.plot.hexbin \(X,y[, C, ...] )

生成一个六角形的装箱图。

DataFrame.plot.hist \([by, bins] )

绘制DataFrame的列的一个直方图。

DataFrame.plot.kde \([bw_method, ind] )

使用高斯核生成核密度估计图。

DataFrame.plot.line \([x, y] )

将系列或数据帧绘制为线条。

DataFrame.plot.pie \(** Kwargs)

生成饼图。

DataFrame.plot.scatter \(X,y[, s, c] )

创建具有不同标记点大小和颜色的散点图。

DataFrame.boxplot \([column, by, ax, ...] )

从DataFrame列制作框图。

DataFrame.hist \([column, by, grid, ...] )

制作DataFrame的列的直方图。

稀疏访问器#

稀疏数据类型特定的方法和属性在 DataFrame.sparse 访问者。

DataFrame.sparse.density 

非稀疏点与总(密集)数据点的比率。

DataFrame.sparse.from_spmatrix \(数据[, ...] )

从大量稀疏矩阵创建新的DataFrame。

DataFrame.sparse.to_coo \()

以稀疏的SciPy COO矩阵形式返回帧的内容。

DataFrame.sparse.to_dense \()

将具有稀疏值的DataFrame转换为密集。

序列化/IO/转换#

DataFrame.from_dict \(数据[, orient, dtype, ...] )

从类似数组的字典或字典构造DataFrame。

DataFrame.from_records \(数据[, index, ...] )

将结构化或录制ndarray转换为DataFrame。

DataFrame.to_parquet \([path, engine, ...] )

将DataFrame写入二进制拼图格式。

DataFrame.to_pickle \(路径[, compression, ...] )

Pickle(序列化)对象到文件。

DataFrame.to_csv \([path_or_buf, sep, na_rep, ...] )

将对象写入逗号分隔值(CSV)文件。

DataFrame.to_hdf \(路径_或_buf,键[, mode, ...] )

使用HDFStore将包含的数据写入HDF5文件。

DataFrame.to_sql \(名称,控制 [, schema, ...] )

将存储在DataFrame中的记录写入SQL数据库。

DataFrame.to_dict \([orient, into] )

将DataFrame转换为词典。

DataFrame.to_excel \(EXCEL_编写器[, ...] )

将对象写入Excel工作表。

DataFrame.to_json \([path_or_buf, orient, ...] )

将对象转换为JSON字符串。

DataFrame.to_html \([buf, columns, col_space, ...] )

将DataFrame呈现为HTML表。

DataFrame.to_feather \(路径, ** Kwargs)

将DataFrame写入二进制羽化格式。

DataFrame.to_latex \([buf, columns, ...] )

将对象呈现到LaTeX表格、长表或嵌套表。

DataFrame.to_stata \(路径[, convert_dates, ...] )

将DataFrame对象导出为Stata DTA格式。

DataFrame.to_gbq \(目的地_表[, ...] )

向Google BigQuery表编写一个DataFrame。

DataFrame.to_records \([index, column_dtypes, ...] )

将DataFrame转换为NumPy记录数组。

DataFrame.to_string \([buf, columns, ...] )

将DataFrame呈现为控制台友好的表格输出。

DataFrame.to_clipboard \([excel, sep] )

将对象复制到系统剪贴板。

DataFrame.to_markdown \([buf, mode, index, ...] )

以支持降价的格式打印DataFrame。

DataFrame.style 

返回Styler对象。