摘要: 机器学习技术正在快速发展,以改进分析和理解数据的方式。一些最强大的机器学习工具是免费的,可以通过开源社区轻松访问。在倡导开源社区的前提下,通过对开源项目的贡献,积极致力于将机器学习集成到开源 GIS 应用程序中。本文分析了开源机器学习工具的发展历程,以突出最...
机器学习技术正在快速发展,以改进分析和理解数据的方式。一些最强大的机器学习工具是免费的,可以通过开源社区轻松访问。在倡导开源社区的前提下,通过对开源项目的贡献,积极致力于将机器学习集成到开源 GIS 应用程序中。本文分析了开源机器学习工具的发展历程,以突出最新和最伟大的开源机器学习软件。
Weka - 1993
Weka 包括用于数据准备、分类、回归、聚类和其他用于数据挖掘的机器学习算法的工具。
-
起始日期:1993
-
语言:Java
-
创建者:新西兰怀卡托大学(University of Waikato, NZ)
-
类型:数据准备,模型优化,经典机器学习。
Shogun - 1999
Shogun 提供了高效统一的机器学习方法。
-
起始日期:1999
-
语言:Python、Octave、Java、Scala、Ruby、C#、R、Perl、JavaScript。
-
创建者:NumFOCUS
-
类型:模型优化,经典机器学习。
OpenCV - 2000
OpenCV 是一个计算机视觉和机器学习库,它提供了加速机器感知的通用基础设施。
-
起始日期:2000
-
语言:C++, Python, Java, MATLAB.
-
创建者:Intel
-
类型:数据准备、特征工程。
Torch - 2002
Torch 是一个支持 GPU 上的机器学习算法的科学计算框架。
-
起始日期:2002
-
语言:Lua, LuaJIT, C, CUDA, C++.
-
创建者:Ronan Collobert, Samy Bengio, Johnny Mariéthoz
-
类型:模型开发,神经网络,预测,训练。
R-spatial - 2003
R-Spatial 是利用 R删除的代码和软件包的生态系统,用于处理空间数据并为其增加价值。软件包包括但不限于sf、star、mapview、gstat、spdep、raster 和 terra。
-
起始日期:2003
-
语言:R
-
创建者:R-空间社区
-
类型:数据准备,经典机器学习。
Polyaxon - 2004
Polyaxon 支持构建、培训和监控大规模深度学习应用程序。
-
起始日期:2004
-
语言:Python
-
创建者:Mourafiq, Mourad
-
类型:缩放、模型优化、深度学习。
scikit-learn - 2007
scikit-learn 是一个基于 SciPy 构建的机器学习 Python 模块。
-
起始日期:2007
-
语言:Python
-
创建者:David Cournapeau
-
类型:模型优化,经典机器学习。
Theano - 2007
Theano 允许使用多维数组定义、优化和计算数学表达式。
-
起始日期:2007
-
语言:Python
-
创建者:University of Montreal(蒙特利尔大学)
-
类型:模型优化,经典机器学习。
Accord.NET - 2007
Accor.NET 是一个结合了音频和图像处理库的机器学习框架。
-
起始日期:2007
-
语言:C#
-
创建者:Cesar De Souza
-
类型:数据准备,模型优化,经典机器学习。
Apache Mahout - 2009
ApacheMahout 提供了分布式和可扩展机器学习算法的免费实现。
-
起始日期:2009
-
语言:Java, Scala
-
创建者:Apache Software Foundation
-
类型:模型优化、缩放。
Caffe - 2013
Caffe 提供了一个深度学习框架,其设计具有表达、速度和模块性。
-
起始日期:2013
-
语言:C++, Python
-
创建者:Berkeley AI Research(伯克利人工智能研究)
-
类型:模型优化,深度学习。
GoLearn - 2014
GoLearn 是 Go 的机器学习库。
-
起始日期:2014
-
语言:Go
-
创建者:Stephen James Whitworth
-
类型:模型开发。
GoBrain - 2014
GoBrain 提供用 Go 编写的神经网络。
-
起始日期:2014
-
语言:Go
-
创建者:Jonas Trevisan
-
类型:模型优化,深度学习。
H2O - 2015
H2O 是一个分布式和可扩展的机器学习平台。它与 Hadoop 和 Spark 等大数据技术配合得很好。
-
起始日期:2015
-
语言:R、 Python、Scala、Java、JSON。
-
创建者:H2O
-
类型:模型优化,缩放,经典机器学习,深度学习。
Oryx - 2015
Oryx 2 专门从事实时大规模机器学习。它不仅是构建应用程序的框架,还包括用于协作过滤、分类、回归和集群的打包端到端应用程序。
-
起始日期:2015
-
语言:Java
-
创建者:Sean Owen(肖恩·欧文)
-
类型:模型优化,缩放,经典机器学习。
MLlib - 2015
MLlib 是一个可扩展的机器学习库。它适合 Spark 的 API,并与 Python 中的 NumPy 互操作。
-
起始日期:2015
-
语言:Java, Python
-
创建者:Apache 软件基金会
-
类型:模型优化,缩放,经典机器学习。
TensorFlow - 2015
TensorFlow 是一个端到端平台,为最先进的机器学习提供了灵活的工具生态系统。
-
起始日期:2015
-
语言:Python, C++, Haskell, Java, Go, Rust, JavaScript.
-
创建者:Google
-
类型:模型开发、模型优化、深度学习、缩放、强化学习。
Keras - 2015
Keras 提供了一致且简单的 API 来减少认知负荷。
-
起始日期:2015
-
语言:Python
-
创建者:Google
-
类型:模型开发、模型优化、深度学习、API。
Dask - 2015
Dask 是一个用于分析的灵活并行计算库。
-
起始日期:2015
-
语言:Python
-
创建者:Matt Rocklin(马特·罗克林)
-
类型:缩放比例。
Cortex - 2016
Cortex 是用于可扩展机器学习的云基础设施。
-
起始日期:2016
-
语言:Python
-
创建者:Grafana Labs
-
类型:模型优化、缩放。
Microsoft Cognitive Toolkit - 2016
Microsoft 认知工具包是用于商业级分布式深度学习的工具包。用户可以组合流行的模型类型,并跨多个服务器和 GPU 实现算法。
-
起始日期:2016
-
语言:Python, C++, BrainScript.
-
创建者:Microsoft
-
类型:模型开发、模型优化、深度学习、缩放。
PyTorch - 2016
PyTorch 是用于计算机视觉和自然语言处理等应用程序的机器学习框架。
-
起始日期:2016
-
语言:Python, C++.
-
创建者:Facebook 人工智能研究
-
类型:模型开发、模型优化、深度学习、强化学习。
Featuretools - 2017
Featuretools 是一个自动化特征工程框架,擅长将时间和关系数据集更改为特征矩阵。
-
起始日期:2017
-
语言:Python
-
创建者:Alteryx
-
类型:数据准备。
BigDL - 2017
BigDL 是用于 Apache Spark 的分布式深度学习库。用户可以将深度学习应用程序编写为 Spark 程序。
-
起始日期:2017
-
语言:Scala, Python, Java.
-
创建者:Jason (Jinquan) Dai, Yiheng Wang, Xin Qiu, Ding Ding, Yao Zhang, Yanzhang Wang, Xianyan Jia, Li (Cherry) Zhang, Yan Wan, Zhichao Li, Jiao Wang, Shengsheng Huang, Zhongyuan Wu, Yang Wang, Yuhao Yang, Bowen She, Dongjie Shi, Qi Lu, Kai Huang, and Guoqiong Song.
-
类型:模型优化、缩放。
Ray - 2017
Ray 为构建分布式应用程序提供了通用 API。
-
起始日期:2017
-
语言:Python, C++
-
创建者:anyscale
-
类型:模型开发、模型优化、强化学习、缩放。
TVM - 2017
TVM 将注重生产力的深度学习与注重性能和效率的硬件后端连接起来。
-
起始日期:2017
-
语言:Python, C++
-
创建者:OctoML
-
类型:模型开发、缩放、深度学习。
DVC - 2017
数据版本控制(DVC)用于数据科学和机器学习项目。
-
起始日期:2017
-
语言:Python
-
创建者:Iterative
-
类型:模型优化、数据准备。
MLflow - 2018
MLflow 通过跟踪实验、打包代码和共享、部署模型来简化机器学习开发。
-
起始日期:2018
-
语言:Python, R, Java, Scala.
-
创建者:Databricks
-
类型:模型优化,模型开发,缩放,深度学习,经典机器学习。
Transformers - 2018
Transformers 为 Pytorch、TensorFlow 和 JAX 提供机器学习。文本、视觉和音频等任务有数千个预训练模型。
-
起始日期:2018
-
语言:Python
-
创建者:Hugging Face
-
类型:模型优化,深度学习。
Compose - 2019
Compose 用于自动预测工程。使用 Compose,可以构建预测并生成用于监督学习的标签。
-
起始日期:2019
-
语言:Python
-
创建者:Alteryx
-
类型:数据准备。
Gradio - 2019
Gradio 用于创建基于 web 的UI,使用户能够实时与模型交互,使模型演示变得简单。
-
起始日期:2019
-
语言:Python
-
创建者:Gradio
-
类型:UI, API
PyTorch Lightning - 2019
PyTorch Lightning 是一个用于缩放模型的研究框架。
-
起始日期:2019
-
语言:Python
-
创建者:William Falcon
-
类型:模型开发、模型优化、深度学习、强化学习。
Feast - 2019
Feast 是机器学习应用程序的一个功能存储库,也是模型训练的分析数据生成路径。
-
起始日期:2019
-
语言:Java
-
创建者:Tecton
-
类型:功能工程。
CML - 2020
连续机器学习(CML)是实现连续集成和交付的工具。它可以自动化开发工作流,如:机器供应、模型培训和比较 ML 体验。
-
起始日期:2020
-
语言:Python
-
创建者:Iterative
-
类型:模型优化、数据准备。
Aesara - 2020
Aesara 允许用户使用多维数组定义、优化和评估数学表达式。
-
起始日期:2020
-
语言:Python
-
创建者:Aesara 贡献者
-
类型:数学
Fastai - 2020
Fastai 是一个深度学习结果库,它让研究人员混合低级别的组件来构建新的方法。
-
起始日期:2020
-
语言:Python
-
创建者:Jeremy Howard和Rachel Thomas 博士
-
类型:模型开发、模型优化、深度学习。
auto-sklearn - 2021
auto sklearn 从用户手中接管算法选择和超级处理器调整,利用贝叶斯优化、元学习和集成构建。
-
起始日期:2021
-
语言:Python
-
创建者:Matthias Feurer, Katharina Eggensperger, Stefan Falkner, Marius Lindauer, and Frank Hutter.
-
类型:模型优化,经典机器学习。