版本0.5.0(2011年10月24日)#
新功能#
Added
DataFrame.align
具有标准联接选项的方法Added
parse_dates
选项以执行以下操作read_csv
和read_table
方法可以选择尝试分析索引列中的日期Added
nrows
,chunksize
,以及iterator
争论到read_csv
和read_table
。最后两个返回一个新的TextParser
能够懒惰地迭代平面文件块的类 (GH242 )Added ability to join on multiple columns in
DataFrame.join
(GH214)添加了私有
_get_duplicates
函数用于Index
用于更轻松地识别重复值 (ENH5c)Added 对DataFrame的列属性访问。
Implemented
Series.describe
对于包含对象的系列 (GH241 )Implemented selecting DataFrame columns by passing a list to
__getitem__
(GH253)Implemented &和|分别与索引对象相交/并集 (GH261 )
Implemented
Panel.rename_axis
功能 (GH243 )DataFrame将在控制台输出中显示索引级别名称 (GH334 )
Implemented
Panel.take
Added 方便性
set_index
用于从现有列创建DataFrame索引的函数Implemented
groupby
层次化索引级别名称 (GH223 )Added support for different delimiters in
DataFrame.to_csv
(GH244)
性能增强#
VBENCH在文件解析函数方面的主要性能改进
read_csv
和read_table
VBENCH添加了用于将元组快速转换为ndarray的Cython函数。加快了许多与多索引相关的操作
VBENCH重构了将代码合并/加入到一个整洁的类中,并在浮点/对象情况下禁用了不必要的计算,从而获得了大约10%的性能提升 (GH211 )
VBENCH提高了速度
DataFrame.xs
在混合类型的DataFrame对象上减少约5倍,从0.3.0回归 (GH215 )带新功能的VBENCH
DataFrame.align
方法,将不同索引的DataFrame对象之间的二进制操作速度提高了10%-25%。VBENCH显著加快了嵌套DICT到DataFrame的转换速度 (GH212 )
VBENCH显著提高了数据帧的速度
__repr__
和count
关于大型混合类型DataFrame对象
贡献者#
共有9人为此次发布贡献了补丁。名字中带有“+”的人第一次贡献了一个补丁。
Aman Thakral +
Luca Beltrame +
Nick Pentreath +
Skipper Seabold
Thomas Kluyver +
Wes McKinney
Yaroslav Halchenko +
lodagro +
unknown +