Whoosh简介

关于Whoosh

Whoosh 是由 Matt Chaput . 它开始是一个快速和糟糕的搜索服务器,用于 Houdini 3D动画软件包。副作用软件慷慨地允许Matt打开代码的源代码,以防它可能对任何其他需要非常灵活或纯粹的Python搜索引擎(或两者)的人有用。.

  • whoosh速度很快,但只使用纯python,因此它可以在python运行的任何地方运行,而不需要编译器。
  • 默认情况下,whoosh使用 Okapi BM25F 排名功能,但像大多数事情一样,排名功能可以很容易地定制。
  • 与许多其他搜索库相比,whoosh创建的索引非常小。
  • whoosh中的所有索引文本必须 统一码.
  • whoosh允许您用索引文档存储任意的python对象。

Whoosh是什么?

whoosh是一个快速、纯粹的python搜索引擎库。

whoosh的主要设计动力是它是纯Python。您应该能够使用任何可以使用Python、没有编译器或Java所需的WHOSOH。

Like one of its ancestors, Lucene, Whoosh is not really a search engine, it's a programmer library for creating a search engine [1] .

实际上,“Whoosh”的重要行为都不是硬编码的。文本索引、每个字段中每个术语存储的信息级别、搜索查询的解析、允许的查询类型、评分算法等都是可定制、可替换和可扩展的。

[1]当然,可以在whoosh的基础上构建一个全包搜索引擎,就像nutch和solr使用lucene一样。

Whoosh 能为你做什么?

whoosh可以为自由格式或结构化文本编制索引,然后根据简单或复杂的搜索条件快速查找匹配的文档。

寻求Whoosh的帮助

您可以查看 Whoosh Bitbucket page 并获得有关 Whoosh mailing list .