0.20.2版(2017年6月4日)#

这是0.20.x系列中的一个较小的错误修复版本,包括一些小的回归修复、错误修复和性能改进。我们建议所有用户升级到此版本。

增强#

  • 解除阻止访问可复制文件中支持的其他压缩类型:‘blosc:blosclz’、‘blosc:lz4’、‘blosc:lz4hc’、‘blosc:Snappy’、‘blosc:zlib’、‘blosc:zstd’ (GH14478 )

  • Series 提供一个 to_latex 方法 (GH16180 )

  • 一种新的Groupby方法 ngroup() ,与现有的 cumcount() ,已添加以返回集团订单 (GH11642 );请参阅 here

性能改进#

  • 使用类似列表的索引时的性能回归修复 (GH16285 )

  • 针对多指数的性能回归修复 (GH16319GH16346 )

  • 改进的性能 .clip() 使用标量参数 (GH15400 )

  • 使用分类分组器改进了Groupby的性能 (GH16413 )

  • Improved performance of MultiIndex.remove_unused_levels() (GH16556)

错误修复#

  • 已在某些Windows环境中静默检测终端大小时出现的有关“tput:终端属性:没有这样的设备或地址”的警告。此修复程序仅适用于python3 (GH16496 )

  • 在使用中出现错误 pathlib.Pathpy.path.local 具有io函数的对象 (GH16291 )

  • Bug in Index.symmetric_difference() on two equal MultiIndex's, results in a TypeError (GH13490)

  • Bug in DataFrame.update() with overwrite=False and NaN values (GH15593)

  • 将无效引擎传递给 read_csv() 现在提出一个信息性的 ValueError 而不是 UnboundLocalError 。 (GH16511 )

  • 窃听 unique() 在元组数组上 (GH16519 )

  • 窃听 cut() 什么时候 labels 会导致不正确的标注排序 (GH16459 )

  • Fixed a compatibility issue with IPython 6.0's tab completion showing deprecation warnings on Categoricals (GH16409)

转换#

  • 窃听 to_numeric() 在这种情况下,空数据输入导致解释器出现段错误 (GH16302 )

  • 广播时静音麻木警告 DataFrameSeries 与对比行动 (GH16378GH16306 )

标引#

  • 窃听 DataFrame.reset_index(level=) 使用单级索引 (GH16263 )

  • 使用单调但不是严格单调的索引错误地反转切片边界的部分字符串索引中的错误 (GH16515 )

  • 窃听 MultiIndex.remove_unused_levels() 它不会返回一个 MultiIndex 与原件相同。 (GH16556 )

IO#

  • 窃听 read_csv() 什么时候 comment 在以空格分隔的文本文件中传递 (GH16472 )

  • 窃听 read_csv() 中不存在列的情况下未引发异常 usecols 当它有正确的长度时 (GH14671 )

  • 强制不必要地导入剪贴板例程的错误,可能会在启动时导致导入错误 (GH16288 )

  • Bug that raised IndexError when HTML-rendering an empty DataFrame (GH15953)

  • 窃听 read_csv() 其中,tarfile对象输入在C引擎的Python2.x中引发错误 (GH16530 )

  • BUG在哪里 DataFrame.to_html() 忽略了 index_names 参数 (GH16493 )

  • BUG在哪里 pd.read_hdf() 返回索引名称的NumPy字符串 (GH13492 )

  • 窃听 HDFStore.select_as_multiple() 其中启动/停止参数不受尊重 (GH16209 )

标绘#

  • Bug in DataFrame.plot with a single column and a list-like color (GH3486)

  • Bug in plot where NaT in DatetimeIndex results in Timestamp.min (GH12405)

  • 窃听 DataFrame.boxplot 哪里 figsize 未分组的箱形图不支持关键字 (GH11959 )

分组依据/重采样/滚动#

  • Bug in creating a time-based rolling window on an empty DataFrame (GH15819)

  • 窃听 rolling.cov() 带偏移窗口 (GH16058 )

  • 窃听 .resample().groupby() 在对整数进行聚合时 (GH16361 )

稀疏#

  • Bug in construction of SparseDataFrame from scipy.sparse.dok_matrix (GH16179)

重塑#

  • 窃听 DataFrame.stack 中的未排序级别 MultiIndex 列 (GH16323 )

  • 窃听 pd.wide_to_long() 在以下情况下未引发错误 i 不是唯一的标识符 (GH16382 )

  • 窃听 Series.isin(..) 具有元组列表的 (GH16394 )

  • 在构造一个 DataFrame 具有包括全NAT列的混合数据类型。 (GH16395 )

  • 窃听 DataFrame.agg()Series.agg() 在不可调用属性上进行聚合 (GH16405 )

数字#

  • 窃听 .interpolate() ,在哪里 limit_direction 不受尊重的时候 limit=None (默认)已传递 (GH16282 )

直截了当的#

  • 修复了在两个类别都是无序的情况下考虑类别顺序的比较操作 (GH16014 )

其他#

  • 窃听 DataFrame.drop() 具有具有非唯一索引的空列表 (GH16270 )

贡献者#

共有34人为此次发布贡献了补丁。名字中带有“+”的人第一次贡献了一个补丁。

  • Aaron Barber +

  • Andrew 亮 +

  • Becky Sweger +

  • Christian Prinoth +

  • Christian Stade-Schuldt +

  • DSM

  • Erik Fredriksen +

  • Hugues Valois +

  • Jeff Reback

  • Jeff Tratner

  • JimStearns206 +

  • John W. O'Brien

  • Joris Van den Bossche

  • JosephWagner +

  • Keith Webber +

  • Mehmet Ali "Mali" Akmanalp +

  • Pankaj Pandey

  • Patrick Luo +

  • Patrick O'Melveny +

  • Pietro Battiston

  • RobinFiveWords +

  • Ryan Hendrickson +

  • SimonBaron +

  • Tom Augspurger

  • WBare +

  • bpraggastis +

  • chernrick +

  • chris-b1

  • economy +

  • gfyoung

  • jaredsnyder +

  • keitakurita +

  • linebp

  • lloydkirk +