5大企业最佳开源搜索引擎软件

5大企业最佳开源搜索引擎软件


发布日期: 2022-01-07 更新日期: 2022-01-07 编辑:xuzhiping 浏览次数: 5311

标签:

摘要: 想为自己的企业拥有一个像 Google 这样的搜索引擎吗?那么开源可能会提供解决方案。有几个著名的搜索引擎软件,可以称之为最好的企业开源搜索引擎软件,因其允许在企业域内搜索信息,从多个数据库和 Intranet 中 搜索数据,该数据库和 Intranet 是为...

想为自己的企业拥有一个像 Google 这样的搜索引擎吗?那么开源可能会提供解决方案。有几个著名的搜索引擎软件,可以称之为最好的企业开源搜索引擎软件,因其允许在企业域内搜索信息,从多个数据库和 Intranet 中 搜索数据,该数据库和 Intranet 是为工作而构建的,并保存企业重要数据和其他信息。

这些企业搜索引擎服务器软件可以安装在笔记本电脑上进行测试,然后再安装到服务器上。这些开源引擎的功能类似于谷歌和雅虎,但特别适用于初创企业或企业,搜索引擎可以从多个数据库和 内部网中索引,但不仅限于它们;来自不同文件系统、文件管理系统和电子邮件的文件索引也是可能的。

开源大数据搜索软件还可以采集结构化和非结构化数据。管理员还可以使用安全策略来限制用户访问任何特定的信息集合。

Apache Lucene Core

Apache Lucene Core 是最可靠的跨平台开源搜索引擎项目,在 Apache 许可下分发,完全基于 Java。然而,尽管它纯粹是用 Java 编写的,但也可以移植到其他编程语言中并可用,例如 Delphi、Perl、C#、C++、Python、Ruby 和 PHP,其工作原理是排名搜索系统,这意味着首先返回最好的结果。Lucene 使用可插拔的排名模型,包括向量空间模型和 Okapi BM25。它还支持许多强大的查询类型:短语查询、通配符查询、邻近查询、范围查询等等。

Elasticsearch 开源搜索引擎

Elasticsearch 是一个开源搜索引擎软件,基于 Apache Lucene 的分布式 RESTful 搜索和分析引擎,是一个高度可扩展的开源搜索引擎,这意味着可以支持中小型企业 到大型企业。Elastic 搜索引擎通过 HTTP Web 界面 和 Schema-free JSON 文档提供全文搜索功能。它是一个分布式搜索系统,这意味着每个索引都由可配置数量的 分片完全分片。此外,每个分片可以有一个或多个副本,并且可以在任何副本分片上执行读取/搜索操作。使用 Java 开发,其客户端官方提供了多种语言,如 Curl、Java、.NET(C#)、Python、JavaScript、PHP、Perl、Ruby、Apache Groovy 等。

Apache Solr 搜索引擎平台开源

在 ElasticSearch 之后,Apache Solr 是另一个流行的 开源搜索引擎软件,也是根据 DB 排名,使用Java开发,支持全文搜索和实时索引。此外,与 Elasticsearch 一样,Apache Solr 也是基于 Lucene 并使用其 Java 搜索库。它是一个具有类似 REST 的 API 的独立企业搜索服务器,可通过 JSON、XML、CSV 或基于 HTTP 的二进制在 Solr 中进行索引,使用 HTTP GET 接收查询结果。

Solr 有一个插件架构,允许增加搜索引擎的索引和查询功能。此外,作为开源软件,还可以自定义其代码以根据要求运行插件。

Sphinx 搜索引擎

已经使用过 Elasticsearch 并寻找其他选项的人 可以尝试使用 Sphinx。它也是一个支持全文的免费 开源信息检索软件库,作为用 C++ 编写的独立服务器来实现,且在 Linux(RedHat、Ubuntu 等)、Windows、MacOS、Solaris、FreeBSD 和一些其他系统上运行。

它可以索引和搜索存储在 SQL 数据库和 NoSQL 存储中的数据,为一些高度记录的网站提供支持,这些网站每天生成数百万个 搜索查询,例如 Craigslist、Living Social、MetaCafe 和 Groupon……

如果谈论到这个开源搜索引擎的索引速度,那么它可以为每个 CPU 核心每秒索引高达 10-15 MB 的文本,即每台服务器 60+ MB/秒(在专用索引机上)。它的几个关键特性是:批量和实时全文索引、非文本属性支持、SQL 数据库索引、易于应用程序集成、高级全文搜索语法、丰富的类似数据库的查询功能、更好的相关性排名、灵活的文本处理和分布式搜索。

Xapian

Xapian 是另一个用 C++ 编写的开源搜索引擎库,其绑定允许使用Perl、Python 2、Python 3、PHP 5、PHP 7、Java、Tcl、C#、Ruby、Lua、Erlang、Node.js 和 R。

相关推荐

关注公众号
获取免费资源

随机推荐


Copyright © Since 2014. 开源地理空间基金会中文分会 吉ICP备05002032号

Powered by TorCMS

OSGeo 中国中心 邮件列表

问题讨论 : 要订阅或者退订列表,请点击 订阅

发言 : 请写信给: osgeo-china@lists.osgeo.org