版本1.4#

有关该版本主要亮点的简短描述,请参阅 scikit-learn 1.4的发布亮点 .

换象传说

  • Major Feature 一些你以前做不到的大事。

  • Feature 一些你以前做不到的事情。

  • Efficiency 现有功能现在可能不需要那么多的计算或内存。

  • Enhancement 一个杂七杂八的小改进。

  • Fix 以前没有按照记录或合理预期发挥作用的事情现在应该起作用了。

  • API Change 您需要更改您的代码才能在将来产生相同的效果;或者将来将删除某个功能。

版本1.4.2#

April 2024

此版本仅包括对numpy 2的支持。

版本1.4.1#

February 2024

更改型号#

元数据路由#

数据框架支持#

  • Enhancement Fix Pandas and Polars dataframe are validated directly without ducktyping checks. #28195 by Thomas Fan.

影响多个模块的变更#

Changelog#

sklearn.calibration#

sklearn.cluster#

sklearn.compose#

sklearn.ensemble#

sklearn.impute#

sklearn.inspection#

sklearn.linear_model#

sklearn.preprocessing#

sklearn.tree#

sklearn.utils#

版本1.4.0#

January 2024

更改型号#

以下估计量和函数在与相同的数据和参数进行匹配时,可能会产生与之前版本不同的模型。这种情况通常是由于建模逻辑(错误修复或增强)或随机抽样过程的变化而发生的。

  • Efficiency linear_model.LogisticRegressionlinear_model.LogisticRegressionCV 现在,求解器有了更好的收敛性 "lbfgs""newton-cg" .根据指定的 tol .此外,LBFG可以更好地利用 tol ,即,更快停止或达到更高精度。注意:lbfgs是默认解算器,因此此更改可能会影响许多模型。这一变化也意味着,使用这个新版本的scikit-learn, coef_intercept_ 对于这两个解算器,您的模型的值将发生变化(再次拟合相同数据时)。更改量取决于指定的 tol ,对于较小的值,您将获得更精确的结果。 #26721 通过 Christian Lorentzen .

  • Fix 使用Cython损失函数修复PyPy中出现的估计器内存泄漏。 #27670 通过 Guillaume Lemaitre .

影响所有模块的更改#

元数据路由#

以下模型现在支持一种或多种方法中的元数据路由。参阅 Metadata Routing User Guide 了解更多详细信息。

支持SciPy稀疏阵列#

一些估计器现在支持SciPy稀疏阵列。以下功能和类受到影响:

Functions:

Classes:

支持数组API#

有几个估计器和函数支持 Array API .此类更改允许将估计器和函数与JAX、CuPy和PyTorch等其他库一起使用。因此,这可以实现一些GOP加速计算。

看到 数组API支持(实验性) 了解更多详细信息。

Functions:

Classes:

私人损失功能模块#

Changelog#

sklearn.base#

sklearn.calibration#

sklearn.cluster#

sklearn.compose#

sklearn.covariance#

sklearn.datasets#

sklearn.decomposition#

sklearn.ensemble#

sklearn.feature_extraction#

sklearn.feature_selection#

sklearn.inspection#

sklearn.kernel_ridge#

sklearn.linear_model#

sklearn.metrics#

sklearn.model_selection#

sklearn.multioutput#

sklearn.neighbors#

sklearn.preprocessing#

sklearn.tree#

sklearn.utils#

  • Enhancement sklearn.utils.estimator_html_repr 根据浏览器的颜色动态调整图表颜色 prefers-color-scheme, providing improved adaptability to dark mode environments. #26862 by Andrew Goh Yisheng, Thomas Fan , Adrin Jalali .

  • Enhancement MetadataRequestMetadataRouter 现在有一个 consumes 一种方法,可用于检查是否会消耗给定的参数集。 #26831 通过 Adrin Jalali .

  • Enhancement 使 sklearn.utils.check_array 尝试输出 int32 - 如果非零条目的数量足够小,则从DIA阵列转换时索引CSR和COO阵列。这确保了Cython中实现的估计器不接受 int64 - 索引稀疏数据结构,现在一致接受SciPy稀疏矩阵和数组相同的稀疏输入格式。 #27372 通过 Guillaume Lemaitre .

  • Fix sklearn.utils.check_array 应该接受来自稀疏SciPy模块的矩阵和数组。如果出现以下情况,之前的实现就会失败 copy=True 通过调用特定的NumPy np.may_share_memory 这不适用于SciPy稀疏数组,并且不会返回SciPy稀疏矩阵的正确结果。 #27336 通过 Guillaume Lemaitre .

  • Fix check_estimators_picklereadonly_memmap=True 现在依赖于joblib自己的能力,在加载序列化估计器时分配对齐的内存映射阵列,而不是调用专用私有函数,该函数在OpenBLAS错误检测到中央处理器架构时会崩溃。 #27614 通过 Olivier Grisel .

  • Fix 错误信息 check_array 当传递稀疏矩阵时, accept_sparseFalse 现在建议使用 .toarray() 而不是 X.toarray() . #27757 通过 Lucy Liu .

  • Fix 修复功能 check_array 当输入是Series而不是DataFrame时,输出正确的错误消息。 #28090 通过 Stan FurrerYao Xiao .

  • API Change sklearn.extmath.log_logistic 已被弃用并将在1.6中删除。使用 -np.logaddexp(0, -x) 而不是. #27544 通过 Christian Lorentzen .

代码和文档贡献者

感谢自1.3版本以来为项目维护和改进做出贡献的所有人,包括:

101 AlexMartin,Abhishek Singh Kushwah,Adam Li,Adarsh Wase,Adrin Jalali,Advik Sinha,Alex,Alexander Al-Feghali,Alexis IMBRT,AlexL,Alex Molas,Anam Fatima,Andrew Goh,andyscanzio,Aniket Patil,Artem Kislovskiy,Arturo Amor,ashah 002,avm 19,Ben Holmes,Ben Mares,Benoit Chevallier-Mames,Bharat Raghunathan,Binesh Bannerjee,Brendan Lu,Brevin Kunde,Camille Troillard,Carlo Lemos,Chad Parmet、Christian Clauss、Christian Lorentzen、Christian Veenhuis、Christos Aridas、Cindy Liang、Claudio Salvatore Arcidiacono、Connor Boyle、cynthias 13 w、DaminK、Daniele Ongari、Daniel Schmitz、Daniel Tinoco、David Brochart、Deborah L. Haar,DevanshKyada27,Dimitri Papadopoulos Orfanos,Dmitry Nesterov,DUONG,Edoardo Abati,Eitan Hemed,Elabonga Atuo,Elisabeth Günther,Emma Carballal,Emmanuel Ferdman,表观性,Erwan Le Floch,Fabian Egli,Filip Karlo Došilović,Florian Idelberger,Franck Charras,Gael Varoquaux,Ganesh Tata,Hleb Levitski,Guillaume Lemaitre,Haoying Zhang,Harmanan Kohli,Ily,ioangtop,IsaacTrost,Isaac Virshup,Iwona Zdzieblo,Jakub Kaczmarzyk、James McDermott、Jarrod Millman、JB Mountford、Jérémie du Boisberranger、Jérôme Dockès、Jiiwei Zhang、Joel Nothman、John Cant、John Hopfensperger、Jona Sassenhagen、Jon Nordby、Julien Jerphanion、Kennedy Waweru、kevin moore、Kian Eliasi、Kishan Ved、Konstantinos Pitas、Koustav Ghosh、Kushan Sharma、ldwy 4、Linus、Lohit SundaramahaLingam、Loic Esteve、Lorenz、Louis Fouquet、Lucy Liu、Luis Silvestrin、Luis Silvestrin、Luis Silvestrin、LukáFolwarczn、Lukas Geiger、Malte Lonschien、Marcus Fraa、Marek Hanu、Maren Westermann、Mark Elliot、Martin Larralde、Mateusz Sokó、mathurinm、mecopur、Meekail Zain、Michael Higgins、Miki Watanabe、Milton Gomez、MN193、Mohammed Hamdy、Mohit Joshi、mrastgoo、Naman Dhingra、Naoise Holohan、Narendra Singh dangi、Noa Malem-Shinitski、诺兰、Nurseit Kamchyev、Oleksii Kachaiev、Olivier Grisel、Omar Salman、Partev、Peter Hull、Peter Steinbach、Pierre de Fréminville、Pooja Subramaniam、Puneeth K、qmarcou、Quentin Barthélemy、Rahil Parikh、Rahul Mahajan、Raj Pulapakura、Raphael、Ricardo Peres、Riccardo Cappuzzo、Roman Lutz、Salim Dohri、Samuel O. Ronsin、Sandip Dutta、Sayed Qaiser Ali、scaja、scikit-learn-bot、Sebastian Berg、Shreesha Kumar Bhat、Shubhal Gupta、Søren Fuglede Jørgensen、Stefanie Senger、Tamara、Tanjina Afroj、THARAK HEGDE、thebabush、Thomas J. Fan、Thomas Roehr、Tialo、Tim Head、tongyu、Venkatachalam N、Vijeth Moudgalya、Vincent M、Vivek Reddy P、Vladimir Fokow、肖元、徐学峰、杨涛、姚晓、周宇晨、平松雄介