0.19.2版(2016年12月24日)#

这是0.19.x系列中的一个较小的错误修复版本,包括一些小的回归修复、错误修复和性能改进。我们建议所有用户升级到此版本。

亮点包括:

V0.19.2中的新特性

增强#

这个 pd.merge_asof() ,在0.19.0中添加,获得了一些改进:

  • pd.merge_asof() gained left_index/right_indexleft_by/right_by 论据 (GH14253 )

  • pd.merge_asof() 中可以包含多个列 by 参数,并具有专用的数据类型以获得更好的性能 (GH13936 )

性能改进#

  • Performance regression with PeriodIndex (GH14822)

  • 使用getitem标引时的性能回归 (GH14930 )

  • Improved performance of .replace() (GH12745)

  • 提高了性能 Series 使用DateTime索引和词典数据创建 (GH14894 )

错误修复#

  • 与Python3.6相比,可以酸洗一些偏移量 (GH14685 )

  • 对于某些索引异常类型,与Python3.6进行比较 (GH14684GH14689 )

  • 与Python3.6比较以获得测试套件中的弃用警告 (GH14681 )

  • 将时间戳泡菜与Python3.6进行比较 (GH14689 )

  • 与之比较 dateutil==2.6.0 ;测试套件中报告的段故障 (GH14621 )

  • 允许 nanoseconds 在……里面 Timestamp.replace 作为一名武士 (GH14621 )

  • 窃听 pd.read_csv 其中的混叠是为 na_values 当作为词典传递时 (GH14203 )

  • 窃听 pd.read_csv 其中列索引用于类词典 na_values 我们没有受到尊重 (GH14203 )

  • 窃听 pd.read_csv 如果标头的数量等于文件中的行数,则读取文件失败 (GH14515 )

  • 窃听 pd.read_csv 对于在多字符分隔符未使用引号时引发无用错误消息的Python引擎 (GH14582 )

  • 修复错误 (GH14734GH13654 ) pd.read_saspandas.io.sas.sas7bdat.SAS7BDATReader 这导致在以增量方式读取SAS文件时出现问题。

  • 窃听 pd.read_csv 对于在以下情况下引发了无用错误消息的Python引擎 skipfooter 没有被Python的CSV库所尊重 (GH13879 )

  • 窃听 .fillna() 其中时区感知日期时间64值被错误地四舍五入 (GH14872 )

  • 窃听 .groupby(..., sort=True) 使用多个级别分组时的非词法排序的多索引 (GH14776 )

  • 窃听 pd.cut 具有负值和单个存储箱 (GH14652 )

  • 窃听 pd.to_numeric 其中0不是无符号的 downcast='unsigned' 论据 (GH14401 )

  • 使用共享轴绘制规则和不规则时间序列时出错 (sharex=Trueax.twinx() ) (GH13341GH14322 )。

  • 在解析无效日期时间时不传播异常的错误,已在Python3.6中注明 (GH14561 )

  • Bug in resampling a DatetimeIndex in local TZ, covering a DST change, which would raise AmbiguousTimeError (GH14682)

  • Bug in indexing that transformed RecursionError into KeyError or IndexingError (GH14554)

  • Bug in HDFStore when writing a MultiIndex when using data_columns=True (GH14435)

  • Bug in HDFStore.append() when writing a Series and passing a min_itemsize argument containing a value for the index (GH11412)

  • 写入时出错 HDFStore 在……里面 table 格式设置为 min_itemsize 属性的值 index 在没有要求的情况下 (GH10381 )

  • Bug in Series.groupby.nunique() raising an IndexError for an empty Series (GH12553)

  • 窃听 DataFrame.nlargestDataFrame.nsmallest 当索引具有重复值时 (GH13412 )

  • 在带有Unicode和分隔符的python2上的Linux上的剪贴板函数中存在错误 (GH13747 )

  • Windows 10和Python3上的剪贴板函数中存在错误 (GH14362GH12807 )

  • 窃听 .to_clipboard() 和Excel兼容 (GH12529 )

  • 窃听 DataFrame.combine_first() 对于整型列 (GH14687 )。

  • 窃听 pd.read_csv() 其中 dtype 参数因数据为空而不受影响 (GH14712 )

  • 窃听 pd.read_csv() 其中 nrows 在使用C引擎进行分析时,对于大输入,不考虑使用参数 (GH7626 )

  • 窃听 pd.merge_asof() 指定容差时,无法处理时区感知的DatetimeIndex (GH14844 )

  • 显式签入 to_stataStataWriter 对于写入双精度值时超出范围的值 (GH14618 )

  • 窃听 .plot(kind='kde') 它没有删除缺失的值来生成KDE图,而是生成了一个空图。 (GH14821 )

  • Bug in unstack() if called with a list of column(s) as an argument, regardless of the dtypes of all columns, they get coerced to object (GH11847)

贡献者#

共有33人为此次发布贡献了补丁。名字中带有“+”的人第一次贡献了一个补丁。

  • Ajay Saxena +

  • Ben Kandel

  • Chris

  • Chris Ham +

  • Christopher C. Aycock

  • Daniel Himmelstein +

  • Dave Willmer +

  • Dr-Irv

  • Jeff Carey +

  • Jeff Reback

  • Joe Jevnik

  • Joris Van den Bossche

  • Julian Santander +

  • Kerby Shedden

  • Keshav Ramaswamy

  • Kevin Sheppard

  • Luca Scarabello +

  • Matt Roeschke +

  • Matti Picus +

  • Maximilian Roos

  • Mykola Golubyev +

  • Nate Yoder +

  • Nicholas Ver Halen +

  • Pawel Kordek

  • Pietro Battiston

  • Rodolfo Fernandez +

  • Tara Adiseshan +

  • Tom Augspurger

  • Yaroslav Halchenko

  • gfyoung

  • hesham.shabana@hotmail.com +

  • sinhrks

  • wandersoncferreira +