Whoosh简介¶
关于Whoosh¶
Whoosh 是由 Matt Chaput . 它开始是一个快速和糟糕的搜索服务器,用于 Houdini 3D动画软件包。副作用软件慷慨地允许Matt打开代码的源代码,以防它可能对任何其他需要非常灵活或纯粹的Python搜索引擎(或两者)的人有用。.
whoosh速度很快,但只使用纯python,因此它可以在python运行的任何地方运行,而不需要编译器。
默认情况下,whoosh使用 Okapi BM25F 排名功能,但像大多数事情一样,排名功能可以很容易地定制。
与许多其他搜索库相比,whoosh创建的索引非常小。
whoosh中的所有索引文本必须 统一码.
whoosh允许您用索引文档存储任意的python对象。
Whoosh是什么?¶
whoosh是一个快速、纯粹的python搜索引擎库。
whoosh的主要设计动力是它是纯Python。您应该能够使用任何可以使用Python、没有编译器或Java所需的WHOSOH。
Like one of its ancestors, Lucene, Whoosh is not really a search engine, it's a programmer library for creating a search engine 1 .
实际上,“Whoosh”的重要行为都不是硬编码的。文本索引、每个字段中每个术语存储的信息级别、搜索查询的解析、允许的查询类型、评分算法等都是可定制、可替换和可扩展的。
- 1
当然,可以在whoosh的基础上构建一个全包搜索引擎,就像nutch和solr使用lucene一样。
Whoosh 能为你做什么?¶
whoosh可以为自由格式或结构化文本编制索引,然后根据简单或复杂的搜索条件快速查找匹配的文档。
寻求Whoosh的帮助¶
您可以查看 Whoosh Bitbucket page 并获得有关 Whoosh mailing list .