版本0.19#

版本0.19.2#

July, 2018

此版本专门为了支持Python 3.7。

版本0.19.1#

October 23, 2017

这是一个错误修复版本,对0.19.0中发布的功能进行了一些小的文档改进和增强。

请注意,此版本中的TSNE输出可能存在微小差异(由于 #9623 ),在多个样本与某个样本具有相等距离的情况下。

Changelog#

API更改#

  • 撤销了添加的 metrics.ndcg_scoremetrics.dcg_score 该版本已错误合并到0.19.0版本中。 这些实现被破坏且没有记录。

  • return_train_score 它被添加到 model_selection.GridSearchCV , model_selection.RandomizedSearchCVmodel_selection.cross_validate 在0.19.0版中,将在0.21版中将其默认值从True更改为False。 我们发现,在某些情况下,计算训练分数可能会对交叉验证运行时间产生很大影响。 用户应明确设置 return_train_score 如果预测或评分功能缓慢,导致对CV运行时间产生有害影响,则为True;如果他们希望使用计算出的分数,则为True。 #9677 通过 Kumar AshutoshJoel Nothman .

  • correlation_modelsregression_models 遗留的高斯过程的实施已被迟来的废弃。 #9717 通过 Kumar Ashutosh .

Bug修复#

0.19.0中的回归在0.19.1中修复:

增强功能#

代码和文档贡献者#

感谢:

Joel Nothman、Loic Esteve、Andreas Mueller、Kumar Ashutosh、Vrishank Bhardwaj、Hanmin Qin、Rasul Kerimov、James Bourbeau、Nagarjuna Kumar、Nathaniel Saul、Olivier Grisel、Roman Yurchak、Reiichiro Nakano、Sachin Kelkar、Sam Steingold、Yaroslav Halchenko、diegodlh、fount、goncalo-rodrigues、jkleint、oliblum 90、pasbi、Anthony Gitter、Ben Lawson、Charlie Brummitt、Didi Bar-Zev、Gael Varoquaux、Joan Massich、Joris Van den Bossche,尼尔森马克11

版本0.19#

August 12, 2017

亮点#

我们很高兴能够发布一些很棒的新功能,包括 neighbors.LocalOutlierFactor 对于异常检测, preprocessing.QuantileTransformer 用于强大的特征变换, multioutput.ClassifierChain 元估计器简单地考虑多标签问题中类之间的依赖性。我们在现有的估计器中有一些新的算法,例如相乘更新 decomposition.NMF 及多项式 linear_model.LogisticRegression 具有L1损失(使用 solver='saga' ).

交叉验证现在能够返回多个指标评估的结果。新 model_selection.cross_validate 可以返回测试数据以及训练集性能和时间的许多分数,并且我们扩展了 scoringrefit 网格/随机搜索的参数 to handle multiple metrics .

您还可以学习得更快。 你比如说 new option to cache transformationspipeline.Pipeline 使管道上的网格搜索(包括缓慢转换)更加高效。 并且您可以更快地预测:如果您确定自己知道自己在做什么,则可以使用 config_context .

我们还进行了一些重要的修复。 我们已经修复了一个长期存在的实现错误 metrics.average_precision_score ,因此请谨慎使用该函数报告的先前结果。 在一些错误中, manifold.TSNE 实现已修复,特别是在默认的Barnes-Hut逼近中。 semi_supervised.LabelSpreadingsemi_supervised.LabelPropagation 已经有了实质性的修复。LabelPropagation先前已中断。LabelSpreading现在应该正确地遵守其alpha参数。

更改型号#

以下估计量和函数在与相同的数据和参数进行匹配时,可能会产生与之前版本不同的模型。这种情况通常是由于建模逻辑(错误修复或增强)或随机抽样过程的变化而发生的。

详细信息见下面的变更日志。

(虽然我们试图通过提供这些信息来更好地告知用户,但我们不能保证此列表是完整的。

Changelog#

新功能#

分类器和回归器

其他估计数

模型选择与评估

杂项

  • 输入数据不包含NaN或inf的验证现在可以通过使用来抑制 config_context ,风险自负。这将节省运行时间,并且对于预测时间可能特别有用。 #7548 通过 Joel Nothman .

  • 添加了一个测试以确保文档字符串中的参数列表与函数/类签名匹配。 #9206 通过 Alexandre GramfortRaghav RV .

增强功能#

树木和合奏

线性、核心化和相关模型

其他预测因素

分解、多维学习和集群

预处理和特征选择

模型评估和元估计量

Metrics

杂项

Bug修复#

树木和合奏

线性、核心化和相关模型

其他预测因素

分解、多维学习和集群

预处理和特征选择

模型评估和元估计量

Metrics

杂项

API变更摘要#

树木和合奏

  • 梯度提升基本模型不再是估计器。通过 Andreas Müller .

  • 所有基于树的估计器现在都接受 min_impurity_decrease 参数代替 min_impurity_split ,现在已被废弃。的 min_impurity_decrease 至少有助于停止分裂因分裂而加权杂质减少的节点 min_impurity_decrease . #8449 通过 Raghav RV .

线性、核心化和相关模型

其他预测因素

分解、多维学习和集群

预处理和特征选择

模型评估和元估计量

杂项

  • 否决该 y 参数 transforminverse_transform .方法不应该接受 y 参数,因为它在预测时使用。 #8174 通过 Tahar Zanouda , Alexandre GramfortRaghav RV .

  • SciPy >= 0.13.3和NumPy >= 1.8.2现在是scikit-learn的最低支持版本。中的以下回传函数 sklearn.utils 已被相应删除或弃用。 #8854#8874 通过 Naoya Kanai

  • store_covariancescovariances_ 参数 discriminant_analysis.QuadraticDiscriminantAnalysis 已更名为 store_covariancecovariance_ 的相应参数名保持一致, discriminant_analysis.LinearDiscriminantAnalysis .它们将在0.21版本中被删除。 #7998 通过 Jiacheng

    在0.19中删除:

    • utils.fixes.argpartition

    • utils.fixes.array_equal

    • utils.fixes.astype

    • utils.fixes.bincount

    • utils.fixes.expit

    • utils.fixes.frombuffer_empty

    • utils.fixes.in1d

    • utils.fixes.norm

    • utils.fixes.rankdata

    • utils.fixes.safe_copy

    0.19中废弃,0.21中删除:

    • utils.arpack.eigs

    • utils.arpack.eigsh

    • utils.arpack.svds

    • utils.extmath.fast_dot

    • utils.extmath.logsumexp

    • utils.extmath.norm

    • utils.extmath.pinvh

    • utils.graph.graph_laplacian

    • utils.random.choice

    • utils.sparsetools.connected_components

    • utils.stats.rankdata

  • 两种方法的估计者 decision_functionpredict_proba 现在要求它们之间具有单调关系。述的方法 check_decision_proba_consistency 号已加入 utils.estimator_checks 以检查它们的一致性。 #7578 通过 Shubham Bhardwaj

  • 所有签到 utils.estimator_checks ,特别是 utils.estimator_checks.check_estimator 现在接受估计器实例。大多数其他检查不再接受估计器类。 #9019 通过 Andreas Müller .

  • 确保估计者的属性以结尾 _ 不在构造函数中设置,而仅在 fit 法最值得注意的是,系综估计量(源自 ensemble.BaseEnsemble) now only have self.estimators_ available after fit. #7464 by Lars BuitinckLoic Esteve .

代码和文档贡献者#

感谢自0.18版本以来为项目的维护和改进做出贡献的所有人,包括:

Joel Nothman, Loic Esteve, Andreas Mueller, Guillaume Lemaitre, Olivier Grisel, Hanmin Qin, Raghav RV, Alexandre Gramfort, themrmax, Aman Dalmia, Gael Varoquaux, Naoya Kanai, Tom Dupré la Tour, Rishikesh, Nelson Liu, Taehoon Lee, Nelle Varoquaux, Aashil, Mikhail Korobov, Sebastin Santy, Joan Massich, Roman Yurchak, RAKOTOARISON Herilalaina, Thierry Guillemot, Alexandre Abadie, Carol Willing, Balakumaran Manoharan, Josh Karnofsky, Vlad Niculae, Utkarsh Upadhyay, Dmitry Petrov, Minghui Liu, Srivatsan, Vincent Pham, Albert Thomas, Jake VanderPlas, Attractadore, JC Liu, alexandercbooth, chkoar, Óscar Nájera, Aarshay Jain, Kyle Gilliam, Ramana Subramanyam, CJ Carey, Clement Joudet, David Robles, He Chen, Joris Van den Bossche, Karan Desai, Katie Luangkote, Leland McInnes, Maniteja Nandana, Michele Lacchia, Sergei Lebedev, Shubham Bhardwaj, akshay0724, omtcyfz, rickiepark, waterponey, Vathsala Achar, jbDelafosse, Ralf Gommers, Ekaterina Krivich, Vivek Kumar, Ishank Gulati, Dave Elliott, ldirer, Reiichiro Nakano, Levi John Wolf, Mathieu Blondel, Sid Kapur, Dougal J. Sutherland, midinas, mikebenfield, Sourav Singh, Aseem Bansal, Ibraim Ganiev, Stephen Hoover, AishwaryaRK, Steven C. Howell, Gary Foreman, Neeraj Gangwar, Tahar, Jon Crall, dokato, Kathy Chen, ferria, Thomas Moreau, Charlie Brummitt, Nicolas Goix, Adam Kleczewski, Sam Shleifer, Nikita Singh, Basil Beirouti, Giorgio Patrini, Manoj Kumar, Rafael Possas, James Bourbeau, James A. Bednar, Janine Harper, Jaye, Jean Helie, Jeremy Steward, Artsiom, John Wei, Jonathan LIgo, Jonathan Rahn, seanpwilliams, Arthur Mensch, Josh Levy, Julian Kuhlmann, Julien Aubert, Jörn Hees, Kai, shivamgargsya, Kat Hempstalk, Kaushik Lakshmikanth, Kennedy, Kenneth Lyons, Kenneth Myers, Kevin Yap, Kirill Bobyrev, Konstantin Podshumok, Arthur Imbert, Lee Murray, toastedcornflakes, Lera, Li Li, Arthur Douillard, Mainak Jas, tobycheese, Manraj Singh, Manvendra Singh, Marc Meketon, MarcoFalke, Matthew Brett, Matthias Gilch, Mehul Ahuja, Melanie Goetz, Meng, Peng, Michael Dezube, Michal Baumgartner, vibrantabhi19, Artem Golubin, Milen Paskov, Antonin Carette, Morikko, MrMjauh, NALEPA Emmanuel, Namiya, Antoine Wendlinger, Narine Kokhlikyan, NarineK, Nate Guerin, Angus Williams, Ang Lu, Nicole Vavrova, Nitish Pandey, Okhlopkov Daniil Olegovich, Andy Craze, Om Prakash, Parminder Singh, Patrick Carlson, Patrick Pei, Paul Ganssle, Paulo Haddad, Paweł Lorek, Peng Yu, Pete Bachant, Peter Bull, Peter Csizsek, Peter Wang, Pieter Arthur de Jong, Ping-Yao, Chang, Preston Parry, Puneet Mathur, Quentin Hibon, Andrew Smith, Andrew Jackson, 1kastner, Rameshwar Bhaskaran, Rebecca Bilbro, Remi Rampin, Andrea Esuli, Rob Hall, Robert Bradshaw, Romain Brault, Aman Pratik, Ruifeng Zheng, Russell Smith, Sachin Agarwal, Sailesh Choyal, Samson Tan, Samuël Weber, Sarah Brown, Sebastian Pölsterl, Sebastian Raschka, Sebastian Saeger, Alyssa Batula, Abhyuday Pratap Singh, Sergey Feldman, Sergul Aydore, Sharan Yalburgi, willduan, Siddharth Gupta, Sri Krishna, Almer, Stijn Tonk, Allen Riddell, Theofilos Papapanagiotou, Alison, Alexis Mignon, Tommy Boucher, Tommy Löfstedt, Toshihiro Kamishima, Tyler Folkman, Tyler Lanigan, Alexander Junge, Varun Shenoy, Victor Poughon, Vilhelm von Ehrenheim, Aleksandr Sandrovskii, Alan Yee, Vlasios Vasileiou, Warut Vijitbenjaronk, Yang Zhang, Yaroslav Halchenko, Yichuan Liu, Yuichi Fujikawa, affanv14, aivision2020, xor, andreh7, brady salz, campustrampus, Agamemnon Krasoulis, ditenberg, elena-sharova, filipj8, fukatani, gedeck, guiniol, guoci, hakaa1, hongkahjun, i-am-xhy, jakirkham, jaroslaw-weber, jayzed82, jeroko, jmontoyam, jonathan.striebel, josephsalmon, jschendel, leereeves, martin-hahn, mathurinm, mehak-sachdeva, mlewis1729, mlliou112, mthorrell, ndingwall, nuffe, yangarbiter, plagree, pldtc325, Breno Freitas, Brett Olsen, Brian A. Alfano, Brian Burns, polmauri, Brandon Carter, Charlton Austin, Chayant T15h, Chinmaya Pancholi, Christian Danielsen, Chung Yen, Chyi-Kwei Yau, pravarmahajan, DOHMATOB Elvis, Daniel LeJeune, Daniel Hnyk, Darius Morawiec, David DeTomaso, David Gasquez, David Haberthür, David Heryanto, David Kirkby, David Nicholson, rashchedrin, Deborah Gertrude Digges, Denis Engemann, Devansh D, Dickson, Bob Baxley, Don86, E. Lynch-Klarup, Ed Rogers, Elizabeth Ferriss, Ellen-Co2, Fabian Egli, Fang-Chieh Chou, Bing Tian Dai, Greg Stupp, Grzegorz Szpak, Bertrand Thirion, Hadrien Bertrand, Harizo Rajaona, zxcvbnius, Henry Lin, Holger Peters, Icyblade Dai, Igor Andriushchenko, Ilya, Isaac Laughlin, Iván Vallés, Aurélien Bellet, JPFrancoia, Jacob Schreiber, Asish Mahapatra