DataFrame#

构造器#

DataFrame \([data, index, columns, dtype, copy] )

二维、大小可变、可能是异类的表格数据。

属性和基础数据#

Axes

`DataFrame.index`	DataFrame的索引(行标签)。
`DataFrame.columns`	DataFrame的列标签。

`DataFrame.dtypes`	返回DataFrame中的数据类型。
`DataFrame.info` \([verbose, buf, max_cols, ...] )	打印DataFrame的简明摘要。
`DataFrame.select_dtypes` \([include, exclude] )	根据列数据类型返回DataFrame的列的子集。
`DataFrame.values`	返回DataFrame的Numpy表示形式。
`DataFrame.axes`	返回表示DataFrame轴的列表。
`DataFrame.ndim`	返回一个整数，表示轴/数组的维数。
`DataFrame.size`	返回一个int，表示此对象中的元素数。
`DataFrame.shape`	返回表示DataFrame的维度的元组。
`DataFrame.memory_usage` \([index, deep] )	以字节为单位返回每列的内存使用情况。
`DataFrame.empty`	指示Series/DataFrame是否为空。
`DataFrame.set_flags` \(*[, copy, ...] )	返回一个具有更新标志的新对象。

转换#

`DataFrame.astype` \(dtype[, copy, errors] )	将Pandas对象强制转换为指定的dtype `dtype` 。
`DataFrame.convert_dtypes` \([infer_objects, ...] )	使用支持的数据类型将列转换为最佳数据类型 `pd.NA` 。
`DataFrame.infer_objects` \()	尝试为对象列推断更好的数据类型。
`DataFrame.copy` \([deep] )	复制此对象的索引和数据。
`DataFrame.bool` \()	返回单个元素Series或DataFrame的布尔值。

索引、迭代#

`DataFrame.head` \([n] )	返回第一个 n 排好了。
`DataFrame.at`	访问行/列标签对的单个值。
`DataFrame.iat`	按整数位置访问行/列对的单个值。
`DataFrame.loc`	通过标签或布尔数组访问一组行和列。
`DataFrame.iloc`	纯粹基于整数位置的索引，用于按位置选择。
`DataFrame.insert` \(位置，列，值[, ...] )	在DataFrame中的指定位置插入列。
`DataFrame.__iter__` \()	在信息轴上迭代。
`DataFrame.items` \()	迭代(列名，系列)对。
`DataFrame.iteritems` \()	迭代(列名，系列)对。
`DataFrame.keys` \()	获取‘INFO轴’(参见索引了解更多信息)。
`DataFrame.iterrows` \()	将DataFrame行作为(索引，系列)对进行迭代。
`DataFrame.itertuples` \([index, name] )	将DataFrame行作为命名元组进行迭代。
`DataFrame.lookup` \(行_标签，列_标签)	(已弃用)DataFrame的基于标签的“奇特索引”函数。
`DataFrame.pop` \(项目)	返回项目并从框架中删除。
`DataFrame.tail` \([n] )	退还最后一张 n 排好了。
`DataFrame.xs` \(密钥[, axis, level, drop_level] )	从系列/数据帧返回横截面。
`DataFrame.get` \(密钥[, default] )	从给定键的对象中获取项(例如：DataFrame列)。
`DataFrame.isin` \(值)	DataFrame中的每个元素是否包含在值中。
`DataFrame.where` \(条件[, other, inplace, ...] )	替换条件为FALSE的值。
`DataFrame.mask` \(条件[, other, inplace, axis, ...] )	替换条件为True的值。
`DataFrame.query` \(表达式[, inplace] )	使用布尔表达式查询DataFrame的列。

有关以下内容的更多信息： .at ， .iat ， .loc ，以及 .iloc ，请参阅 indexing documentation 。

二元算子函数#

`DataFrame.add` \(其他[, axis, level, fill_value] )	按元素(二元运算符)获取数据帧和其他元素的相加 add )。
`DataFrame.sub` \(其他[, axis, level, fill_value] )	获取数据帧和其他元素的减法(二元运算符 sub )。
`DataFrame.mul` \(其他[, axis, level, fill_value] )	获得数据帧和其他元素的乘法(二元运算符 mul )。
`DataFrame.div` \(其他[, axis, level, fill_value] )	按元素(二元运算符)获取数据帧和其他数据的浮点除法 truediv )。
`DataFrame.truediv` \(其他[, axis, level, ...] )	按元素(二元运算符)获取数据帧和其他数据的浮点除法 truediv )。
`DataFrame.floordiv` \(其他[, axis, level, ...] )	按元素(二元运算符)获取数据帧和其他数据的整数除法 floordiv )。
`DataFrame.mod` \(其他[, axis, level, fill_value] )	获取数据帧和其他元素的模数(二元运算符 mod )。
`DataFrame.pow` \(其他[, axis, level, fill_value] )	获得数据帧和其他元素的指数幂(二元运算符 pow )。
`DataFrame.dot` \(其他)	计算DataFrame和其他元素之间的矩阵乘法。
`DataFrame.radd` \(其他[, axis, level, fill_value] )	按元素(二元运算符)获取数据帧和其他元素的相加 radd )。
`DataFrame.rsub` \(其他[, axis, level, fill_value] )	获取数据帧和其他元素的减法(二元运算符 rsub )。
`DataFrame.rmul` \(其他[, axis, level, fill_value] )	获得数据帧和其他元素的乘法(二元运算符 rmul )。
`DataFrame.rdiv` \(其他[, axis, level, fill_value] )	按元素(二元运算符)获取数据帧和其他数据的浮点除法 rtruediv )。
`DataFrame.rtruediv` \(其他[, axis, level, ...] )	按元素(二元运算符)获取数据帧和其他数据的浮点除法 rtruediv )。
`DataFrame.rfloordiv` \(其他[, axis, level, ...] )	按元素(二元运算符)获取数据帧和其他数据的整数除法 rfloordiv )。
`DataFrame.rmod` \(其他[, axis, level, fill_value] )	获取数据帧和其他元素的模数(二元运算符 rmod )。
`DataFrame.rpow` \(其他[, axis, level, fill_value] )	获得数据帧和其他元素的指数幂(二元运算符 rpow )。
`DataFrame.lt` \(其他[, axis, level] )	获取小于数据帧和其他元素(二元运算符 lt )。
`DataFrame.gt` \(其他[, axis, level] )	获取数据帧和其他元素的大于(二元运算符 gt )。
`DataFrame.le` \(其他[, axis, level] )	按元素(二元运算符)获取小于或等于的数据帧和其他 le )。
`DataFrame.ge` \(其他[, axis, level] )	获取大于或等于数据帧和其他元素(二元运算符 ge )。
`DataFrame.ne` \(其他[, axis, level] )	Get Not等于of DataFrame and Other，以元素为单位(二元运算符 ne )。
`DataFrame.eq` \(其他[, axis, level] )	按元素(二元运算符)获取数据帧和其他的等于 eq )。
`DataFrame.combine` \(其他、函数 [, fill_value, ...] )	与另一个DataFrame执行列合并。
`DataFrame.combine_first` \(其他)	使用中相同位置的值更新空元素 other 。

函数应用程序，分组依据窗口(&W)#

`DataFrame.apply` \(函数[, axis, raw, ...] )	沿DataFrame的轴应用函数。
`DataFrame.applymap` \(函数[, na_action] )	以元素方式将函数应用于数据帧。
`DataFrame.pipe` \(函数，args, *kwargs)	应用预期为Series或DataFrame的可链接函数。
`DataFrame.agg` \([func, axis] )	使用指定轴上的一个或多个操作进行聚合。
`DataFrame.aggregate` \([func, axis] )	使用指定轴上的一个或多个操作进行聚合。
`DataFrame.transform` \(函数[, axis] )	打电话 `func` 关于Self生成与Self具有相同轴形状的DataFrame。
`DataFrame.groupby` \([by, axis, level, ...] )	使用映射器或按一系列列对DataFrame进行分组。
`DataFrame.rolling` \(窗口[, min_periods, ...] )	提供滚动窗口计算。
`DataFrame.expanding` \([min_periods, center, ...] )	提供扩展窗口计算。
`DataFrame.ewm` \([com, span, halflife, alpha, ...] )	提供指数加权(EW)计算。

计算/描述性统计#

`DataFrame.abs` \()	返回一个具有每个元素的绝对数值的Series/DataFrame。
`DataFrame.all` \([axis, bool_only, skipna, level] )	返回是否所有元素都为True，可能是在某个轴上。
`DataFrame.any` \([axis, bool_only, skipna, level] )	返回是否有任何元素为True，可能是在轴上。
`DataFrame.clip` \([lower, upper, axis, inplace] )	修剪输入阈值上的值。
`DataFrame.corr` \([method, min_periods, ...] )	计算列的成对关联，不包括NA/NULL值。
`DataFrame.corrwith` \(其他[, axis, drop, ...] )	计算成对相关。
`DataFrame.count` \([axis, level, numeric_only] )	对每列或每行的非NA单元格进行计数。
`DataFrame.cov` \([min_periods, ddof, numeric_only] )	计算列的成对协方差，不包括NA/NULL值。
`DataFrame.cummax` \([axis, skipna] )	返回DataFrame或Series轴上的累计最大值。
`DataFrame.cummin` \([axis, skipna] )	返回DataFrame或Series轴上的累计最小值。
`DataFrame.cumprod` \([axis, skipna] )	返回DataFrame或Series轴上的累计积。
`DataFrame.cumsum` \([axis, skipna] )	返回DataFrame或Series轴上的累计和。
`DataFrame.describe` \([percentiles, include, ...] )	生成描述性统计数据。
`DataFrame.diff` \([periods, axis] )	单元的一阶离散差分。
`DataFrame.eval` \(表达式[, inplace] )	计算描述DataFrame列上的操作的字符串。
`DataFrame.kurt` \([axis, skipna, level, ...] )	返回请求的轴上的无偏峰度。
`DataFrame.kurtosis` \([axis, skipna, level, ...] )	返回请求的轴上的无偏峰度。
`DataFrame.mad` \([axis, skipna, level] )	(已弃用)返回值在请求的轴上的平均绝对偏差。
`DataFrame.max` \([axis, skipna, level, ...] )	返回请求的轴上的最大值。
`DataFrame.mean` \([axis, skipna, level, ...] )	返回请求的轴上的值的平均值。
`DataFrame.median` \([axis, skipna, level, ...] )	返回值在请求的轴上的中位数。
`DataFrame.min` \([axis, skipna, level, ...] )	返回请求的轴上的最小值。
`DataFrame.mode` \([axis, numeric_only, dropna] )	获取沿所选轴的每个元素的模式。
`DataFrame.pct_change` \([periods, fill_method, ...] )	当前元素和前一个元素之间的百分比变化。
`DataFrame.prod` \([axis, skipna, level, ...] )	返回值在请求的轴上的乘积。
`DataFrame.product` \([axis, skipna, level, ...] )	返回值在请求的轴上的乘积。
`DataFrame.quantile` \([q, axis, numeric_only, ...] )	在请求的轴上返回给定分位数的值。
`DataFrame.rank` \([axis, method, numeric_only, ...] )	沿轴计算数值数据排名(从1到n)。
`DataFrame.round` \([decimals] )	将DataFrame四舍五入到小数位数可变。
`DataFrame.sem` \([axis, skipna, level, ddof, ...] )	返回请求轴上平均值的无偏标准误差。
`DataFrame.skew` \([axis, skipna, level, ...] )	返回请求的轴上的无偏斜。
`DataFrame.sum` \([axis, skipna, level, ...] )	返回请求的轴上的值的总和。
`DataFrame.std` \([axis, skipna, level, ddof, ...] )	返回要求轴上的样本标准偏差。
`DataFrame.var` \([axis, skipna, level, ddof, ...] )	返回请求的轴上的无偏差。
`DataFrame.nunique` \([axis, dropna] )	计算指定轴上的不同元素的数量。
`DataFrame.value_counts` \([subset, normalize, ...] )	返回包含DataFrame中唯一行计数的Series。

重建索引/选择/标签操作#

`DataFrame.add_prefix` \(前缀)	使用字符串为标签添加前缀 prefix 。
`DataFrame.add_suffix` \(后缀)	使用字符串为标签添加后缀 suffix 。
`DataFrame.align` \(其他[, join, axis, level, ...] )	将两个对象的轴向与指定的联接方法对齐。
`DataFrame.at_time` \(时间[, asof, axis] )	选择一天中特定时间(例如上午9：30)的值。
`DataFrame.between_time` \(开始时间_时间，结束时间)	选择一天中特定时间(例如，上午9：00-9：30)之间的值。
`DataFrame.drop` \([labels, axis, index, ...] )	从行或列中删除指定的标签。
`DataFrame.drop_duplicates` \([subset, keep, ...] )	返回删除了重复行的DataFrame。
`DataFrame.duplicated` \([subset, keep] )	返回表示重复行的布尔系列。
`DataFrame.equals` \(其他)	测试两个对象是否包含相同的元素。
`DataFrame.filter` \([items, like, regex, axis] )	根据指定的索引标签子集数据帧的行或列。
`DataFrame.first` \(偏移)	根据日期偏移量选择时间序列数据的初始期间。
`DataFrame.head` \([n] )	返回第一个 n 排好了。
`DataFrame.idxmax` \([axis, skipna] )	返回在请求的轴上第一次出现最大值的索引。
`DataFrame.idxmin` \([axis, skipna] )	返回在请求的轴上第一次出现最小值的索引。
`DataFrame.last` \(偏移)	根据日期偏移量选择时间序列数据的最终期间。
`DataFrame.reindex` \([labels, index, columns, ...] )	使Series/DataFrame符合具有可选填充逻辑的新索引。
`DataFrame.reindex_like` \(其他[, method, ...] )	将索引匹配的对象作为其他对象返回。
`DataFrame.rename` \([mapper, index, columns, ...] )	更改轴标签。
`DataFrame.rename_axis` \([mapper, index, ...] )	设置索引或列的轴的名称。
`DataFrame.reset_index` \([level, drop, ...] )	重置索引或其级别。
`DataFrame.sample` \([n, frac, replace, ...] )	从对象轴返回项目的随机样本。
`DataFrame.set_axis` \(标签[, axis, inplace] )	将所需的索引指定给给定轴。
`DataFrame.set_index` \(密钥[, drop, append, ...] )	使用现有列设置DataFrame索引。
`DataFrame.tail` \([n] )	退还最后一张 n 排好了。
`DataFrame.take` \(索引[, axis, is_copy] )	返回给定元素中的元素位置沿轴的索引。
`DataFrame.truncate` \([before, after, axis, copy] )	在某些索引值之前和之后截断Series或DataFrame。

缺少数据处理#

`DataFrame.backfill` \([axis, inplace, limit, ...] )	的同义词 `DataFrame.fillna()` 使用 `method='bfill'` 。
`DataFrame.bfill` \([axis, inplace, limit, downcast] )	的同义词 `DataFrame.fillna()` 使用 `method='bfill'` 。
`DataFrame.dropna` \([axis, how, thresh, ...] )	删除缺少的值。
`DataFrame.ffill` \([axis, inplace, limit, downcast] )	的同义词 `DataFrame.fillna()` 使用 `method='ffill'` 。
`DataFrame.fillna` \([value, method, axis, ...] )	使用指定的方法填充NA/NaN值。
`DataFrame.interpolate` \([method, axis, limit, ...] )	使用插值法填充NaN值。
`DataFrame.isna` \()	检测缺少的值。
`DataFrame.isnull` \()	DataFrame.isull是DataFrame.isna的别名。
`DataFrame.notna` \()	检测现有(非缺失)值。
`DataFrame.notnull` \()	DataFrame.notull是DataFrame.notna的别名。
`DataFrame.pad` \([axis, inplace, limit, downcast] )	的同义词 `DataFrame.fillna()` 使用 `method='ffill'` 。
`DataFrame.replace` \([to_replace, value, ...] )	替换中给出的值 to_replace 使用 value 。

重塑、排序、调换#

`DataFrame.droplevel` \(级别[, axis] )	返回删除了请求的索引/列级别的Series/DataFrame。
`DataFrame.pivot` \([index, columns, values] )	返回按给定索引/列值组织的整形DataFrame。
`DataFrame.pivot_table` \([values, index, ...] )	将电子表格样式的数据透视表创建为DataFrame。
`DataFrame.reorder_levels` \(订单[, axis] )	使用输入顺序重新排列索引级别。
`DataFrame.sort_values` \(由[, axis, ascending, ...] )	按任一轴上的值排序。
`DataFrame.sort_index` \([axis, level, ...] )	按标签(沿轴)对对象进行排序。
`DataFrame.nlargest` \(n，列[, keep] )	返回第一个 n 行排序依据 columns 按降序排列。
`DataFrame.nsmallest` \(n，列[, keep] )	返回第一个 n 行排序依据 columns 按升序排列。
`DataFrame.swaplevel` \([i, j, axis] )	中交换级别i和j。 `MultiIndex` 。
`DataFrame.stack` \([level, dropna] )	从列到索引堆叠规定的级别。
`DataFrame.unstack` \([level, fill_value] )	透视一级(必须是分层的)索引标签。
`DataFrame.swapaxes` \(axis1、axis2[, copy] )	适当地互换轴和交换值轴。
`DataFrame.melt` \([id_vars, value_vars, ...] )	将DataFrame从宽格式取消透视为长格式，可以选择保留设置的标识符。
`DataFrame.explode` \(列[, ignore_index] )	将类似列表的每个元素转换为行，复制索引值。
`DataFrame.squeeze` \([axis] )	将1维轴对象压缩为标量。
`DataFrame.to_xarray` \()	从Pandas对象返回一个XARRAY对象。
`DataFrame.T`
`DataFrame.transpose` \(*参数[, copy] )	转置索引和列。

合并/比较/合并/合并#

`DataFrame.append` \(其他[, ignore_index, ...] )	(已弃用)追加的行 other 到调用者的末尾，返回一个新对象。
`DataFrame.assign` \(** Kwargs)	将新列分配给DataFrame。
`DataFrame.compare` \(其他[, align_axis, ...] )	与另一个DataFrame进行比较并显示差异。
`DataFrame.join` \(其他[, on, how, lsuffix, ...] )	联接另一个DataFrame的列。
`DataFrame.merge` \(右[, how, on, left_on, ...] )	将DataFrame或命名系列对象与数据库样式联接合并。
`DataFrame.update` \(其他[, join, overwrite, ...] )	使用来自另一个DataFrame的非NA值就地修改。

旗子#

标志是指Pandas对象的属性。数据集的属性(如记录的日期、从中访问它的URL等)应存储在 DataFrame.attrs 。

Flags \(OBJ，*，允许_复制_标签)

适用于Pandas对象的标志。

元数据#

DataFrame.attrs 是用于存储此DataFrame的全局元数据的字典。

警告

DataFrame.attrs 被认为是试验性的，可能会在没有警告的情况下发生变化。

DataFrame.attrs

此数据集的全局属性的字典。

标绘#

DataFrame.plot 是表单的特定绘图方法的可调用方法和命名空间属性 DataFrame.plot.<kind> 。

DataFrame.plot \([x, y, kind, ax, ....] )

数据帧绘制访问器和方法

`DataFrame.plot.area` \([x, y] )	绘制堆叠面积图。
`DataFrame.plot.bar` \([x, y] )	垂直条形图。
`DataFrame.plot.barh` \([x, y] )	绘制水平条形图。
`DataFrame.plot.box` \([by] )	制作DataFrame列的框图。
`DataFrame.plot.density` \([bw_method, ind] )	使用高斯核生成核密度估计图。
`DataFrame.plot.hexbin` \(X，y[, C, ...] )	生成一个六角形的装箱图。
`DataFrame.plot.hist` \([by, bins] )	绘制DataFrame的列的一个直方图。
`DataFrame.plot.kde` \([bw_method, ind] )	使用高斯核生成核密度估计图。
`DataFrame.plot.line` \([x, y] )	将系列或数据帧绘制为线条。
`DataFrame.plot.pie` \(** Kwargs)	生成饼图。
`DataFrame.plot.scatter` \(X，y[, s, c] )	创建具有不同标记点大小和颜色的散点图。

`DataFrame.boxplot` \([column, by, ax, ...] )	从DataFrame列制作框图。
`DataFrame.hist` \([column, by, grid, ...] )	制作DataFrame的列的直方图。

稀疏访问器#

稀疏数据类型特定的方法和属性在 DataFrame.sparse 访问者。

DataFrame.sparse.density

非稀疏点与总(密集)数据点的比率。

`DataFrame.sparse.from_spmatrix` \(数据[, ...] )	从大量稀疏矩阵创建新的DataFrame。
`DataFrame.sparse.to_coo` \()	以稀疏的SciPy COO矩阵形式返回帧的内容。
`DataFrame.sparse.to_dense` \()	将具有稀疏值的DataFrame转换为密集。

序列化/IO/转换#

`DataFrame.from_dict` \(数据[, orient, dtype, ...] )	从类似数组的字典或字典构造DataFrame。
`DataFrame.from_records` \(数据[, index, ...] )	将结构化或录制ndarray转换为DataFrame。
`DataFrame.to_parquet` \([path, engine, ...] )	将DataFrame写入二进制拼图格式。
`DataFrame.to_pickle` \(路径[, compression, ...] )	Pickle(序列化)对象到文件。
`DataFrame.to_csv` \([path_or_buf, sep, na_rep, ...] )	将对象写入逗号分隔值(CSV)文件。
`DataFrame.to_hdf` \(路径_或_buf，键[, mode, ...] )	使用HDFStore将包含的数据写入HDF5文件。
`DataFrame.to_sql` \(名称，控制 [, schema, ...] )	将存储在DataFrame中的记录写入SQL数据库。
`DataFrame.to_dict` \([orient, into] )	将DataFrame转换为词典。
`DataFrame.to_excel` \(EXCEL_编写器[, ...] )	将对象写入Excel工作表。
`DataFrame.to_json` \([path_or_buf, orient, ...] )	将对象转换为JSON字符串。
`DataFrame.to_html` \([buf, columns, col_space, ...] )	将DataFrame呈现为HTML表。
`DataFrame.to_feather` \(路径， ** Kwargs)	将DataFrame写入二进制羽化格式。
`DataFrame.to_latex` \([buf, columns, ...] )	将对象呈现到LaTeX表格、长表或嵌套表。
`DataFrame.to_stata` \(路径[, convert_dates, ...] )	将DataFrame对象导出为Stata DTA格式。
`DataFrame.to_gbq` \(目的地_表[, ...] )	向Google BigQuery表编写一个DataFrame。
`DataFrame.to_records` \([index, column_dtypes, ...] )	将DataFrame转换为NumPy记录数组。
`DataFrame.to_string` \([buf, columns, ...] )	将DataFrame呈现为控制台友好的表格输出。
`DataFrame.to_clipboard` \([excel, sep] )	将对象复制到系统剪贴板。
`DataFrame.to_markdown` \([buf, mode, index, ...] )	以支持降价的格式打印DataFrame。
`DataFrame.style`	返回Styler对象。

pandas.Series.plot.pie

pandas.DataFrame

`DataFrame.asfreq` \(频率 [, method, how, ...] )	将时间序列转换为指定频率。
`DataFrame.asof` \(其中 [, subset] )	返回之前没有任何NAN的最后一行 where 。
`DataFrame.shift` \([periods, freq, axis, ...] )	使用可选时间按所需期间数移位索引 freq 。
`DataFrame.slice_shift` \([periods, axis] )	(已弃用)等同于 shift 而不复制数据。
`DataFrame.tshift` \([periods, freq, axis] )	(已弃用)移动时间索引，使用索引的频率(如果可用)。
`DataFrame.first_valid_index` \()	返回第一个非NA值的索引，如果没有找到非NA值，则返回NONE。
`DataFrame.last_valid_index` \()	返回最后一个非NA值的索引，如果没有找到非NA值，则返回NONE。
`DataFrame.resample` \(规则[, axis, closed, ...] )	重新采样时间序列数据。
`DataFrame.to_period` \([freq, axis, copy] )	将DataFrame从DatetimeIndex转换为PerodIndex。
`DataFrame.to_timestamp` \([freq, how, axis, copy] )	强制转换为时间戳的DatetimeIndex，位于起头属于那个时期。
`DataFrame.tz_convert` \(TZ[, axis, level, copy] )	将TZ感知轴转换为目标时区。
`DataFrame.tz_localize` \(TZ[, axis, level, ...] )	将Series或DataFrame的Tz-naive索引本地化到目标时区。

DataFrame#

构造器#

属性和基础数据#

转换#

索引、迭代#

二元算子函数#

函数应用程序，分组依据窗口(&W)#

计算/描述性统计#

重建索引/选择/标签操作#

缺少数据处理#

重塑、排序、调换#

合并/比较/合并/合并#

与时间序列相关的#

旗子#

元数据#

标绘#

稀疏访问器#

序列化/IO/转换#