版本0.21#

换象传说

  • Major Feature 一些你以前做不到的大事。

  • Feature 一些你以前做不到的事情。

  • Efficiency 现有功能现在可能不需要那么多的计算或内存。

  • Enhancement 一个杂七杂八的小改进。

  • Fix 以前没有按照记录或合理预期发挥作用的事情现在应该起作用了。

  • API Change 您需要更改您的代码才能在将来产生相同的效果;或者将来将删除某个功能。

版本0.21.3#

July 30, 2019

更改型号#

以下估计量和函数在与相同的数据和参数进行匹配时,可能会产生与之前版本不同的模型。这种情况通常是由于建模逻辑(错误修复或增强)或随机抽样过程的变化而发生的。

  • v0.20.0发布说明未能提及中的向后不兼容 metrics.make_scorerneeds_proba=Truey_true 是二进制的。现在,记分器功能应该接受1D y_pred (i.e.,正类概率、形状 (n_samples,) ),而不是2D y_pred (i.e.,形状 (n_samples, 2) ).

Changelog#

sklearn.cluster#

sklearn.compose#

  • Fix 修复了中的一个问题 compose.ColumnTransformer 其中使用列顺序不同的数据框架 fittransform 可能会导致将错误的列悄悄传递到 remainder Transformer。 #14237 通过 Andreas Schuderer <schuderer> .

sklearn.datasets#

sklearn.ensemble#

sklearn.impute#

sklearn.inspection#

  • Fix 修复了中的一个错误 inspection.plot_partial_dependence 哪里 target 多类问题没有考虑参数。 #14393 通过 Guillem G. Subies .

sklearn.linear_model#

sklearn.neighbors#

sklearn.tree#

版本0.21.2#

24 May 2019

Changelog#

sklearn.decomposition#

sklearn.metrics#

sklearn.preprocessing#

sklearn.utils.sparsefuncs#

版本0.21.1#

17 May 2019

这是一个错误修复版本,主要解决0.21.0版本中的一些包装问题。它还包括小的文档改进和一些错误修复。

Changelog#

sklearn.inspection#

sklearn.metrics#

sklearn.neighbors#

版本0.21.0#

May 2019

更改型号#

以下估计量和函数在与相同的数据和参数进行匹配时,可能会产生与之前版本不同的模型。这种情况通常是由于建模逻辑(错误修复或增强)或随机抽样过程的变化而发生的。

详细信息见下面的变更日志。

(虽然我们试图通过提供这些信息来更好地告知用户,但我们不能保证此列表是完整的。

已知的主要bug#

  • 默认 max_iterlinear_model.LogisticRegression 给定默认情况下,对于许多求解器来说太小了 tol .特别是,我们不小心更改了默认值 max_iter 对于Liblinear求解器来说,1000到100次迭代 #3591 发布于0.16版本。在未来的版本中,我们希望选择更好的默认 max_itertol 具体取决于求解器(请参阅 #13317 ).

Changelog#

对Python 3.4及以下版本的支持已正式放弃。

sklearn.base#

sklearn.calibration#

sklearn.cluster#

sklearn.compose#

sklearn.datasets#

sklearn.decomposition#

sklearn.discriminant_analysis#

sklearn.dummy#

sklearn.ensemble#

sklearn.externals#

  • API Change 弃用 externals.six 因为我们已经放弃了对Python 2.7的支持。 #12916 通过 Hanmin Qin .

sklearn.feature_extraction#

sklearn.impute#

  • Major Feature 添加 impute.IterativeImputer ,这是一种通过以循环方式将具有缺失值的每个特征建模为其他特征的函数来估算缺失值的策略。 #8478#12177 通过 Sergey FeldmanBen Lawson .

    IterativeImputer的API是实验性的,可以随时更改,无需任何弃用周期。要使用它们,您需要显式导入 enable_iterative_imputer

    >>> from sklearn.experimental import enable_iterative_imputer  # noqa
    >>> # now you can import normally from sklearn.impute
    >>> from sklearn.impute import IterativeImputer
    
  • Featureimpute.SimpleImputerimpute.IterativeImputer 有一个新参数 'add_indicator' ,它只是堆叠一个 impute.MissingIndicator 转换为输入者的转换的输出。这允许预测估计器考虑缺失。 #12583 , #13601 通过 Danylo Baibak .

  • Fiximpute.MissingIndicator 如果输入稀疏,则通过引发异常来避免隐式加密 missing_values 属性设置为0。 #13240 通过 Bartosz Telenczuk .

  • Fix Fixed two bugs in impute.MissingIndicator. First, when X is sparse, all the non-zero non missing values used to become explicit False in the transformed data. Then, when features='missing-only', all features used to be kept if there were no missing values at all. #13562 by Jérémie du Boisberranger.

sklearn.inspection#

(new分包)

  • Feature 部分依赖图表 (inspection.plot_partial_dependence )现在支持任何回归量或分类器(前提是它们具有 predict_proba 方法)。 #12599 通过 Trevor StephensNicolas Hug .

sklearn.isotonic#

sklearn.linear_model#

sklearn.manifold#

sklearn.metrics#

sklearn.mixture#

sklearn.model_selection#

sklearn.multiclass#

sklearn.multioutput#

sklearn.neighbors#

sklearn.neural_network#

sklearn.pipeline#

sklearn.preprocessing#

sklearn.svm#

  • Fix 修复了中的一个问题 svm.SVC.decision_functiondecision_function_shape='ovr' .由于decision_functioning中使用的缩放,给定样本的decision_函数值会有所不同,具体取决于decision_functioning是在单独的样本上还是在包含该相同样本的批次上评估的。 #10440 通过 Jonathan Ohayon .

sklearn.tree#

sklearn.utils#

多个模块#

  • Major Feature__repr__() 所有估计量的方法(在调用时使用 print(estimator) )已经完全重写,构建在Python漂亮的打印标准库上。默认情况下打印所有参数,但可以使用 print_changed_only 选项 sklearn.set_config . #11705 通过 Nicolas Hug .

  • Major Feature 添加估计者标签:这些是估计器的注释,允许对其能力进行程序性检查,例如稀疏矩阵支持、支持的输出类型和支持的方法。估计器标签还确定在以下情况下在估计器上运行的测试 check_estimator 被称为。阅读更多的 User Guide . #8022 通过 Andreas Müller .

  • Efficiency 当将数组转换为多个估计器中的不同d类型时,可以避免内存副本。 #11973 通过 Roman Yurchak .

  • Fix 修复了实现中的错误 our_rand_r 助手功能在跨平台上表现不一致。 #13422 通过 Madhura ParikhClément Doumouro .

杂项#

  • Enhancement Joblib不再在scikit-learn中出售,而是成为一个依赖。最低支持版本是jobib 0.11,但强烈建议使用版本>= 0.13。 #13531 通过 Roman Yurchak .

估计器检查的更改#

这些变化主要影响库开发人员。

代码和文档贡献者

感谢自0.20版本以来为项目维护和改进做出贡献的所有人,包括:

adanhawth, Aditya Vyas, Adrin Jalali, Agamemnon Krasoulis, Albert Thomas, Alberto Torres, Alexandre Gramfort, amourav, Andrea Navarrete, Andreas Mueller, Andrew Nystrom, assiaben, Aurélien Bellet, Bartosz Michałowski, Bartosz Telenczuk, bauks, BenjaStudio, bertrandhaut, Bharat Raghunathan, brentfagan, Bryan Woods, Cat Chenal, Cheuk Ting Ho, Chris Choe, Christos Aridas, Clément Doumouro, Cole Smith, Connossor, Corey Levinson, Dan Ellis, Dan Stine, Danylo Baibak, daten-kieker, Denis Kataev, Didi Bar-Zev, Dillon Gardner, Dmitry Mottl, Dmitry Vukolov, Dougal J. Sutherland, Dowon, drewmjohnston, Dror Atariah, Edward J Brown, Ekaterina Krivich, Elizabeth Sander, Emmanuel Arias, Eric Chang, Eric Larson, Erich Schubert, esvhd, Falak, Feda Curic, Federico Caselli, Frank Hoang, Fibinse Xavier`, Finn O'Shea, Gabriel Marzinotto, Gabriel Vacaliuc, Gabriele Calvo, Gael Varoquaux, GauravAhlawat, Giuseppe Vettigli, Greg Gandenberger, Guillaume Fournier, Guillaume Lemaitre, Gustavo De Mari Pereira, Hanmin Qin, haroldfox, hhu-luqi, Hunter McGushion, Ian Sanders, JackLangerman, Jacopo Notarstefano, jakirkham, James Bourbeau, Jan Koch, Jan S, janvanrijn, Jarrod Millman, jdethurens, jeremiedbb, JF, joaak, Joan Massich, Joel Nothman, Jonathan Ohayon, Joris Van den Bossche, josephsalmon, Jérémie Méhault, Katrin Leinweber, ken, kms15, Koen, Kossori Aruku, Krishna Sangeeth, Kuai Yu, Kulbear, Kushal Chauhan, Kyle Jackson, Lakshya KD, Leandro Hermida, Lee Yi Jie Joel, Lily Xiong, Lisa Sarah Thomas, Loic Esteve, louib, luk-f-a, maikia, mail-liam, Manimaran, Manuel López-Ibáñez, Marc Torrellas, Marco Gaido, Marco Gorelli, MarcoGorelli, marineLM, Mark Hannel, Martin Gubri, Masstran, mathurinm, Matthew Roeschke, Max Copeland, melsyt, mferrari3, Mickaël Schoentgen, Ming Li, Mitar, Mohammad Aftab, Mohammed AbdelAal, Mohammed Ibraheem, Muhammad Hassaan Rafique, mwestt, Naoya Iijima, Nicholas Smith, Nicolas Goix, Nicolas Hug, Nikolay Shebanov, Oleksandr Pavlyk, Oliver Rausch, Olivier Grisel, Orestis, Osman, Owen Flanagan, Paul Paczuski, Pavel Soriano, pavlos kallis, Pawel Sendyk, peay, Peter, Peter Cock, Peter Hausamann, Peter Marko, Pierre Glaser, pierretallotte, Pim de Haan, Piotr Szymański, Prabakaran Kumaresshan, Pradeep Reddy Raamana, Prathmesh Savale, Pulkit Maloo, Quentin Batista, Radostin Stoyanov, Raf Baluyot, Rajdeep Dua, Ramil Nugmanov, Raúl García Calvo, Rebekah Kim, Reshama Shaikh, Rohan Lekhwani, Rohan Singh, Rohan Varma, Rohit Kapoor, Roman Feldbauer, Roman Yurchak, Romuald M, Roopam Sharma, Ryan, Rüdiger Busche, Sam Waterbury, Samuel O. Ronsin, SandroCasagrande, Scott Cole, Scott Lowe, Sebastian Raschka, Shangwu Yao, Shivam Kotwalia, Shiyu Duan, smarie, Sriharsha Hatwar, Stephen Hoover, Stephen Tierney, Stéphane Couvreur, surgan12, SylvainLan, TakingItCasual, Tashay Green, thibsej, Thomas Fan, Thomas J Fan, Thomas Moreau, Tom Dupré la Tour, Tommy, Tulio Casagrande, Umar Farouk Umar, Utkarsh Upadhyay, Vinayak Mehta, Vishaal Kapoor, Vivek Kumar, Vlad Niculae, vqean3, Wenhao Zhang, William de Vazelhes, xhan, Xing Han Lu, xinyuliu12, Yaroslav Halchenko, Zach Griffith, Zach Miller, Zayd Hammoudeh, Zhuyi Xue, Zijie (ZJ) Poh, ^__^