开源机器学习工具的发展历程

开源机器学习工具的发展历程


发布日期: 2023-01-17 更新日期: 2023-01-17 编辑:xuzhiping 浏览次数: 121

标签:

摘要: 机器学习技术正在快速发展,以改进分析和理解数据的方式。一些最强大的机器学习工具是免费的,可以通过开源社区轻松访问。在倡导开源社区的前提下,通过对开源项目的贡献,积极致力于将机器学习集成到开源 GIS 应用程序中。本文分析了开源机器学习工具的发展历程,以突出最...

开源机器学习工具列表

机器学习技术正在快速发展,以改进分析和理解数据的方式。一些最强大的机器学习工具是免费的,可以通过开源社区轻松访问。在倡导开源社区的前提下,通过对开源项目的贡献,积极致力于将机器学习集成到开源 GIS 应用程序中。本文分析了开源机器学习工具的发展历程,以突出最新和最伟大的开源机器学习软件。

Weka - 1993

Weka 包括用于数据准备、分类、回归、聚类和其他用于数据挖掘的机器学习算法的工具。

  • 起始日期:1993

  • 语言:Java

  • 创建者:新西兰怀卡托大学(University of Waikato, NZ)

  • 类型:数据准备,模型优化,经典机器学习。

Shogun - 1999

Shogun 提供了高效统一的机器学习方法。

  • 起始日期:1999

  • 语言:Python、Octave、Java、Scala、Ruby、C#、R、Perl、JavaScript。

  • 创建者:NumFOCUS

  • 类型:模型优化,经典机器学习。

OpenCV - 2000

OpenCV 是一个计算机视觉和机器学习库,它提供了加速机器感知的通用基础设施。

  • 起始日期:2000

  • 语言:C++, Python, Java, MATLAB.

  • 创建者:Intel

  • 类型:数据准备、特征工程。

Torch - 2002

Torch 是一个支持 GPU 上的机器学习算法的科学计算框架。

  • 起始日期:2002

  • 语言:Lua, LuaJIT, C, CUDA, C++.

  • 创建者:Ronan Collobert, Samy Bengio, Johnny Mariéthoz

  • 类型:模型开发,神经网络,预测,训练。

R-spatial - 2003

R-Spatial 是利用 R删除的代码和软件包的生态系统,用于处理空间数据并为其增加价值。软件包包括但不限于sf、star、mapview、gstat、spdep、raster 和 terra。

  • 起始日期:2003

  • 语言:R

  • 创建者:R-空间社区

  • 类型:数据准备,经典机器学习。

Polyaxon - 2004

Polyaxon 支持构建、培训和监控大规模深度学习应用程序。

  • 起始日期:2004

  • 语言:Python

  • 创建者:Mourafiq, Mourad

  • 类型:缩放、模型优化、深度学习。

scikit-learn - 2007

scikit-learn 是一个基于 SciPy 构建的机器学习 Python 模块。

  • 起始日期:2007

  • 语言:Python

  • 创建者:David Cournapeau

  • 类型:模型优化,经典机器学习。

Theano - 2007

Theano 允许使用多维数组定义、优化和计算数学表达式。

  • 起始日期:2007

  • 语言:Python

  • 创建者:University of Montreal(蒙特利尔大学)

  • 类型:模型优化,经典机器学习。

Accord.NET - 2007

Accor.NET 是一个结合了音频和图像处理库的机器学习框架。

  • 起始日期:2007

  • 语言:C#

  • 创建者:Cesar De Souza

  • 类型:数据准备,模型优化,经典机器学习。

Apache Mahout - 2009

ApacheMahout 提供了分布式和可扩展机器学习算法的免费实现。

  • 起始日期:2009

  • 语言:Java, Scala

  • 创建者:Apache Software Foundation

  • 类型:模型优化、缩放。

Caffe - 2013

Caffe 提供了一个深度学习框架,其设计具有表达、速度和模块性。

  • 起始日期:2013

  • 语言:C++, Python

  • 创建者:Berkeley AI Research(伯克利人工智能研究)

  • 类型:模型优化,深度学习。

GoLearn - 2014

GoLearn 是 Go 的机器学习库。

  • 起始日期:2014

  • 语言:Go

  • 创建者:Stephen James Whitworth

  • 类型:模型开发。

GoBrain - 2014

GoBrain 提供用 Go 编写的神经网络。

  • 起始日期:2014

  • 语言:Go

  • 创建者:Jonas Trevisan

  • 类型:模型优化,深度学习。

H2O - 2015

H2O 是一个分布式和可扩展的机器学习平台。它与 Hadoop 和 Spark 等大数据技术配合得很好。

  • 起始日期:2015

  • 语言:R、 Python、Scala、Java、JSON。

  • 创建者:H2O

  • 类型:模型优化,缩放,经典机器学习,深度学习。

Oryx - 2015

Oryx 2 专门从事实时大规模机器学习。它不仅是构建应用程序的框架,还包括用于协作过滤、分类、回归和集群的打包端到端应用程序。

  • 起始日期:2015

  • 语言:Java

  • 创建者:Sean Owen(肖恩·欧文)

  • 类型:模型优化,缩放,经典机器学习。

MLlib - 2015

MLlib 是一个可扩展的机器学习库。它适合 Spark 的 API,并与 Python 中的 NumPy 互操作。

  • 起始日期:2015

  • 语言:Java, Python

  • 创建者:Apache 软件基金会

  • 类型:模型优化,缩放,经典机器学习。

TensorFlow - 2015

TensorFlow 是一个端到端平台,为最先进的机器学习提供了灵活的工具生态系统。

  • 起始日期:2015

  • 语言:Python, C++, Haskell, Java, Go, Rust, JavaScript.

  • 创建者:Google

  • 类型:模型开发、模型优化、深度学习、缩放、强化学习。

Keras - 2015

Keras 提供了一致且简单的 API 来减少认知负荷。

  • 起始日期:2015

  • 语言:Python

  • 创建者:Google

  • 类型:模型开发、模型优化、深度学习、API。

Dask - 2015

Dask 是一个用于分析的灵活并行计算库。

  • 起始日期:2015

  • 语言:Python

  • 创建者:Matt Rocklin(马特·罗克林)

  • 类型:缩放比例。

Cortex - 2016

Cortex 是用于可扩展机器学习的云基础设施。

  • 起始日期:2016

  • 语言:Python

  • 创建者:Grafana Labs

  • 类型:模型优化、缩放。

Microsoft Cognitive Toolkit - 2016

Microsoft 认知工具包是用于商业级分布式深度学习的工具包。用户可以组合流行的模型类型,并跨多个服务器和 GPU 实现算法。

  • 起始日期:2016

  • 语言:Python, C++, BrainScript.

  • 创建者:Microsoft

  • 类型:模型开发、模型优化、深度学习、缩放。

PyTorch - 2016

PyTorch 是用于计算机视觉和自然语言处理等应用程序的机器学习框架。

  • 起始日期:2016

  • 语言:Python, C++.

  • 创建者:Facebook 人工智能研究

  • 类型:模型开发、模型优化、深度学习、强化学习。

Featuretools - 2017

Featuretools 是一个自动化特征工程框架,擅长将时间和关系数据集更改为特征矩阵。

  • 起始日期:2017

  • 语言:Python

  • 创建者:Alteryx

  • 类型:数据准备。

BigDL - 2017

BigDL 是用于 Apache Spark 的分布式深度学习库。用户可以将深度学习应用程序编写为 Spark 程序。

  • 起始日期:2017

  • 语言:Scala, Python, Java.

  • 创建者:Jason (Jinquan) Dai, Yiheng Wang, Xin Qiu, Ding Ding, Yao Zhang, Yanzhang Wang, Xianyan Jia, Li (Cherry) Zhang, Yan Wan, Zhichao Li, Jiao Wang, Shengsheng Huang, Zhongyuan Wu, Yang Wang, Yuhao Yang, Bowen She, Dongjie Shi, Qi Lu, Kai Huang, and Guoqiong Song.

  • 类型:模型优化、缩放。

Ray - 2017

Ray 为构建分布式应用程序提供了通用 API。

  • 起始日期:2017

  • 语言:Python, C++

  • 创建者:anyscale

  • 类型:模型开发、模型优化、强化学习、缩放。

TVM - 2017

TVM 将注重生产力的深度学习与注重性能和效率的硬件后端连接起来。

  • 起始日期:2017

  • 语言:Python, C++

  • 创建者:OctoML

  • 类型:模型开发、缩放、深度学习。

DVC - 2017

数据版本控制(DVC)用于数据科学和机器学习项目。

  • 起始日期:2017

  • 语言:Python

  • 创建者:Iterative

  • 类型:模型优化、数据准备。

MLflow - 2018

MLflow 通过跟踪实验、打包代码和共享、部署模型来简化机器学习开发。

  • 起始日期:2018

  • 语言:Python, R, Java, Scala.

  • 创建者:Databricks

  • 类型:模型优化,模型开发,缩放,深度学习,经典机器学习。

Transformers - 2018

Transformers 为 Pytorch、TensorFlow 和 JAX 提供机器学习。文本、视觉和音频等任务有数千个预训练模型。

  • 起始日期:2018

  • 语言:Python

  • 创建者:Hugging Face

  • 类型:模型优化,深度学习。

Compose - 2019

Compose 用于自动预测工程。使用 Compose,可以构建预测并生成用于监督学习的标签。

  • 起始日期:2019

  • 语言:Python

  • 创建者:Alteryx

  • 类型:数据准备。

Gradio - 2019

Gradio 用于创建基于 web 的UI,使用户能够实时与模型交互,使模型演示变得简单。

  • 起始日期:2019

  • 语言:Python

  • 创建者:Gradio

  • 类型:UI, API

PyTorch Lightning - 2019

PyTorch Lightning 是一个用于缩放模型的研究框架。

  • 起始日期:2019

  • 语言:Python

  • 创建者:William Falcon

  • 类型:模型开发、模型优化、深度学习、强化学习。

Feast - 2019

Feast 是机器学习应用程序的一个功能存储库,也是模型训练的分析数据生成路径。

  • 起始日期:2019

  • 语言:Java

  • 创建者:Tecton

  • 类型:功能工程。

CML - 2020

连续机器学习(CML)是实现连续集成和交付的工具。它可以自动化开发工作流,如:机器供应、模型培训和比较 ML 体验。

  • 起始日期:2020

  • 语言:Python

  • 创建者:Iterative

  • 类型:模型优化、数据准备。

Aesara - 2020

Aesara 允许用户使用多维数组定义、优化和评估数学表达式。

  • 起始日期:2020

  • 语言:Python

  • 创建者:Aesara 贡献者

  • 类型:数学

Fastai - 2020

Fastai 是一个深度学习结果库,它让研究人员混合低级别的组件来构建新的方法。

  • 起始日期:2020

  • 语言:Python

  • 创建者:Jeremy Howard和Rachel Thomas 博士

  • 类型:模型开发、模型优化、深度学习。

auto-sklearn - 2021

auto sklearn 从用户手中接管算法选择和超级处理器调整,利用贝叶斯优化、元学习和集成构建。

  • 起始日期:2021

  • 语言:Python

  • 创建者:Matthias Feurer, Katharina Eggensperger, Stefan Falkner, Marius Lindauer, and Frank Hutter.

  • 类型:模型优化,经典机器学习。

相关推荐

关注公众号
获取免费资源

随机推荐


Copyright © Since 2014. 开源地理空间基金会中文分会 吉ICP备05002032号

Powered by TorCMS

OSGeo 中国中心 邮件列表

问题讨论 : 要订阅或者退订列表,请点击 订阅

发言 : 请写信给: osgeo-china@lists.osgeo.org