DataFrame#
构造器#
|
二维、大小可变、可能是异类的表格数据。 |
属性和基础数据#
Axes
DataFrame的索引(行标签)。 |
|
DataFrame的列标签。 |
返回DataFrame中的数据类型。 |
|
|
打印DataFrame的简明摘要。 |
|
根据列数据类型返回DataFrame的列的子集。 |
返回DataFrame的Numpy表示形式。 |
|
返回表示DataFrame轴的列表。 |
|
返回一个整数,表示轴/数组的维数。 |
|
返回一个int,表示此对象中的元素数。 |
|
返回表示DataFrame的维度的元组。 |
|
|
以字节为单位返回每列的内存使用情况。 |
指示Series/DataFrame是否为空。 |
|
|
返回一个具有更新标志的新对象。 |
转换#
|
将Pandas对象强制转换为指定的dtype |
|
使用支持的数据类型将列转换为最佳数据类型 |
尝试为对象列推断更好的数据类型。 |
|
|
复制此对象的索引和数据。 |
|
返回单个元素Series或DataFrame的布尔值。 |
索引、迭代#
|
返回第一个 n 排好了。 |
访问行/列标签对的单个值。 |
|
按整数位置访问行/列对的单个值。 |
|
通过标签或布尔数组访问一组行和列。 |
|
纯粹基于整数位置的索引,用于按位置选择。 |
|
|
在DataFrame中的指定位置插入列。 |
在信息轴上迭代。 |
|
|
迭代(列名,系列)对。 |
迭代(列名,系列)对。 |
|
|
获取‘INFO轴’(参见索引了解更多信息)。 |
将DataFrame行作为(索引,系列)对进行迭代。 |
|
|
将DataFrame行作为命名元组进行迭代。 |
|
(已弃用)DataFrame的基于标签的“奇特索引”函数。 |
|
返回项目并从框架中删除。 |
|
退还最后一张 n 排好了。 |
|
从系列/数据帧返回横截面。 |
|
从给定键的对象中获取项(例如:DataFrame列)。 |
|
DataFrame中的每个元素是否包含在值中。 |
|
替换条件为FALSE的值。 |
|
替换条件为True的值。 |
|
使用布尔表达式查询DataFrame的列。 |
有关以下内容的更多信息: .at
, .iat
, .loc
,以及 .iloc
,请参阅 indexing documentation 。
二元算子函数#
|
按元素(二元运算符)获取数据帧和其他元素的相加 add )。 |
|
获取数据帧和其他元素的减法(二元运算符 sub )。 |
|
获得数据帧和其他元素的乘法(二元运算符 mul )。 |
|
按元素(二元运算符)获取数据帧和其他数据的浮点除法 truediv )。 |
|
按元素(二元运算符)获取数据帧和其他数据的浮点除法 truediv )。 |
|
按元素(二元运算符)获取数据帧和其他数据的整数除法 floordiv )。 |
|
获取数据帧和其他元素的模数(二元运算符 mod )。 |
|
获得数据帧和其他元素的指数幂(二元运算符 pow )。 |
|
计算DataFrame和其他元素之间的矩阵乘法。 |
|
按元素(二元运算符)获取数据帧和其他元素的相加 radd )。 |
|
获取数据帧和其他元素的减法(二元运算符 rsub )。 |
|
获得数据帧和其他元素的乘法(二元运算符 rmul )。 |
|
按元素(二元运算符)获取数据帧和其他数据的浮点除法 rtruediv )。 |
|
按元素(二元运算符)获取数据帧和其他数据的浮点除法 rtruediv )。 |
|
按元素(二元运算符)获取数据帧和其他数据的整数除法 rfloordiv )。 |
|
获取数据帧和其他元素的模数(二元运算符 rmod )。 |
|
获得数据帧和其他元素的指数幂(二元运算符 rpow )。 |
|
获取小于数据帧和其他元素(二元运算符 lt )。 |
|
获取数据帧和其他元素的大于(二元运算符 gt )。 |
|
按元素(二元运算符)获取小于或等于的数据帧和其他 le )。 |
|
获取大于或等于数据帧和其他元素(二元运算符 ge )。 |
|
Get Not等于of DataFrame and Other,以元素为单位(二元运算符 ne )。 |
|
按元素(二元运算符)获取数据帧和其他的等于 eq )。 |
|
与另一个DataFrame执行列合并。 |
|
使用中相同位置的值更新空元素 other 。 |
函数应用程序,分组依据窗口(&W)#
|
沿DataFrame的轴应用函数。 |
|
以元素方式将函数应用于数据帧。 |
|
应用预期为Series或DataFrame的可链接函数。 |
|
使用指定轴上的一个或多个操作进行聚合。 |
|
使用指定轴上的一个或多个操作进行聚合。 |
|
打电话 |
|
使用映射器或按一系列列对DataFrame进行分组。 |
|
提供滚动窗口计算。 |
|
提供扩展窗口计算。 |
|
提供指数加权(EW)计算。 |
计算/描述性统计#
|
返回一个具有每个元素的绝对数值的Series/DataFrame。 |
|
返回是否所有元素都为True,可能是在某个轴上。 |
|
返回是否有任何元素为True,可能是在轴上。 |
|
修剪输入阈值上的值。 |
|
计算列的成对关联,不包括NA/NULL值。 |
|
计算成对相关。 |
|
对每列或每行的非NA单元格进行计数。 |
|
计算列的成对协方差,不包括NA/NULL值。 |
|
返回DataFrame或Series轴上的累计最大值。 |
|
返回DataFrame或Series轴上的累计最小值。 |
|
返回DataFrame或Series轴上的累计积。 |
|
返回DataFrame或Series轴上的累计和。 |
|
生成描述性统计数据。 |
|
单元的一阶离散差分。 |
|
计算描述DataFrame列上的操作的字符串。 |
|
返回请求的轴上的无偏峰度。 |
|
返回请求的轴上的无偏峰度。 |
|
(已弃用)返回值在请求的轴上的平均绝对偏差。 |
|
返回请求的轴上的最大值。 |
|
返回请求的轴上的值的平均值。 |
|
返回值在请求的轴上的中位数。 |
|
返回请求的轴上的最小值。 |
|
获取沿所选轴的每个元素的模式。 |
|
当前元素和前一个元素之间的百分比变化。 |
|
返回值在请求的轴上的乘积。 |
|
返回值在请求的轴上的乘积。 |
|
在请求的轴上返回给定分位数的值。 |
|
沿轴计算数值数据排名(从1到n)。 |
|
将DataFrame四舍五入到小数位数可变。 |
|
返回请求轴上平均值的无偏标准误差。 |
|
返回请求的轴上的无偏斜。 |
|
返回请求的轴上的值的总和。 |
|
返回要求轴上的样本标准偏差。 |
|
返回请求的轴上的无偏差。 |
|
计算指定轴上的不同元素的数量。 |
|
返回包含DataFrame中唯一行计数的Series。 |
重建索引/选择/标签操作#
|
使用字符串为标签添加前缀 prefix 。 |
|
使用字符串为标签添加后缀 suffix 。 |
|
将两个对象的轴向与指定的联接方法对齐。 |
|
选择一天中特定时间(例如上午9:30)的值。 |
|
选择一天中特定时间(例如,上午9:00-9:30)之间的值。 |
|
从行或列中删除指定的标签。 |
|
返回删除了重复行的DataFrame。 |
|
返回表示重复行的布尔系列。 |
|
测试两个对象是否包含相同的元素。 |
|
根据指定的索引标签子集数据帧的行或列。 |
|
根据日期偏移量选择时间序列数据的初始期间。 |
|
返回第一个 n 排好了。 |
|
返回在请求的轴上第一次出现最大值的索引。 |
|
返回在请求的轴上第一次出现最小值的索引。 |
|
根据日期偏移量选择时间序列数据的最终期间。 |
|
使Series/DataFrame符合具有可选填充逻辑的新索引。 |
|
将索引匹配的对象作为其他对象返回。 |
|
更改轴标签。 |
|
设置索引或列的轴的名称。 |
|
重置索引或其级别。 |
|
从对象轴返回项目的随机样本。 |
|
将所需的索引指定给给定轴。 |
|
使用现有列设置DataFrame索引。 |
|
退还最后一张 n 排好了。 |
|
返回给定元素中的元素 位置 沿轴的索引。 |
|
在某些索引值之前和之后截断Series或DataFrame。 |
缺少数据处理#
|
的同义词 |
|
的同义词 |
|
删除缺少的值。 |
|
的同义词 |
|
使用指定的方法填充NA/NaN值。 |
|
使用插值法填充NaN值。 |
|
检测缺少的值。 |
|
DataFrame.isull是DataFrame.isna的别名。 |
|
检测现有(非缺失)值。 |
DataFrame.notull是DataFrame.notna的别名。 |
|
|
的同义词 |
|
替换中给出的值 to_replace 使用 value 。 |
重塑、排序、调换#
|
返回删除了请求的索引/列级别的Series/DataFrame。 |
|
返回按给定索引/列值组织的整形DataFrame。 |
|
将电子表格样式的数据透视表创建为DataFrame。 |
|
使用输入顺序重新排列索引级别。 |
|
按任一轴上的值排序。 |
|
按标签(沿轴)对对象进行排序。 |
|
返回第一个 n 行排序依据 columns 按降序排列。 |
|
返回第一个 n 行排序依据 columns 按升序排列。 |
|
中交换级别i和j。 |
|
从列到索引堆叠规定的级别。 |
|
透视一级(必须是分层的)索引标签。 |
|
适当地互换轴和交换值轴。 |
|
将DataFrame从宽格式取消透视为长格式,可以选择保留设置的标识符。 |
|
将类似列表的每个元素转换为行,复制索引值。 |
|
将1维轴对象压缩为标量。 |
从Pandas对象返回一个XARRAY对象。 |
|
|
转置索引和列。 |
合并/比较/合并/合并#
|
(已弃用)追加的行 other 到调用者的末尾,返回一个新对象。 |
|
将新列分配给DataFrame。 |
|
与另一个DataFrame进行比较并显示差异。 |
|
联接另一个DataFrame的列。 |
|
将DataFrame或命名系列对象与数据库样式联接合并。 |
|
使用来自另一个DataFrame的非NA值就地修改。 |
旗子#
标志是指Pandas对象的属性。数据集的属性(如记录的日期、从中访问它的URL等)应存储在 DataFrame.attrs
。
|
适用于Pandas对象的标志。 |
元数据#
DataFrame.attrs
是用于存储此DataFrame的全局元数据的字典。
警告
DataFrame.attrs
被认为是试验性的,可能会在没有警告的情况下发生变化。
此数据集的全局属性的字典。 |
标绘#
DataFrame.plot
是表单的特定绘图方法的可调用方法和命名空间属性 DataFrame.plot.<kind>
。
|
数据帧绘制访问器和方法 |
|
绘制堆叠面积图。 |
|
垂直条形图。 |
|
绘制水平条形图。 |
|
制作DataFrame列的框图。 |
|
使用高斯核生成核密度估计图。 |
|
生成一个六角形的装箱图。 |
|
绘制DataFrame的列的一个直方图。 |
|
使用高斯核生成核密度估计图。 |
|
将系列或数据帧绘制为线条。 |
|
生成饼图。 |
|
创建具有不同标记点大小和颜色的散点图。 |
|
从DataFrame列制作框图。 |
|
制作DataFrame的列的直方图。 |
稀疏访问器#
稀疏数据类型特定的方法和属性在 DataFrame.sparse
访问者。
非稀疏点与总(密集)数据点的比率。 |
|
从大量稀疏矩阵创建新的DataFrame。 |
以稀疏的SciPy COO矩阵形式返回帧的内容。 |
|
将具有稀疏值的DataFrame转换为密集。 |
序列化/IO/转换#
|
从类似数组的字典或字典构造DataFrame。 |
|
将结构化或录制ndarray转换为DataFrame。 |
|
将DataFrame写入二进制拼图格式。 |
|
Pickle(序列化)对象到文件。 |
|
将对象写入逗号分隔值(CSV)文件。 |
|
使用HDFStore将包含的数据写入HDF5文件。 |
|
将存储在DataFrame中的记录写入SQL数据库。 |
|
将DataFrame转换为词典。 |
|
将对象写入Excel工作表。 |
|
将对象转换为JSON字符串。 |
|
将DataFrame呈现为HTML表。 |
|
将DataFrame写入二进制羽化格式。 |
|
将对象呈现到LaTeX表格、长表或嵌套表。 |
|
将DataFrame对象导出为Stata DTA格式。 |
|
向Google BigQuery表编写一个DataFrame。 |
|
将DataFrame转换为NumPy记录数组。 |
|
将DataFrame呈现为控制台友好的表格输出。 |
|
将对象复制到系统剪贴板。 |
|
以支持降价的格式打印DataFrame。 |
返回Styler对象。 |