filedb 注解

TBD。

创建文件

<revision_number>.toc

包含索引及其段信息的“主”文件。

索引目录将包含每个段的一组文件。段就像一个小索引——当你向索引中添加文档时,whoosh会创建一个新段,然后搜索旧段和新段,以避免每次添加文档时都要进行大合并。当你得到足够的小片段时,Whoosh将它们合并成较大的片段或单个片段。

<segment_number>.dci

包含每个文档的信息(例如字段长度)。这将随着文档数量的增加而线性增长。

<segment_number>.dcz

包含每个文档的存储字段。

<segment_number>.tiz

包含每个术语的信息。文件大小将根据唯一术语的数量而变化。

<segment_number>.pst

包含每期过账。此文件的大小取决于集合的大小和每个字段使用的格式(例如,存储术语位置比仅存储频率占用更多空间)。

<segment_number>.fvz

包含每个文档的术语向量(正向索引)。仅当架构中至少有一个字段存储术语向量时,才会创建此文件。大小将根据文档数量、字段长度、每个向量使用的格式(例如,存储术语位置比仅存储频率占用更多空间)等而变化。