8.5. 分析命令

这些命令用于分析数据集。所需的参数用 *

看见 配置缓存的统计信息 有关缓存统计信息的详细信息,请参阅。

8.5.1. stats-bounds

显示或计算架构属性的界限。

论据

描述

-c, --catalog *

包含架构元数据的目录表

-f, --feature-name *

架构的名称

-q, --cql

用于过滤要考虑的要素的CQL

-a, --attributes

要计算边界的特定属性

--no-cache

不使用缓存的统计数据

默认情况下,将显示预计算(缓存)边界。缓存的边界可能不是完全精确的,但它们可以立即使用。如果 --no-cache 参数,则将通过对数据运行查询来计算边界。这将给出准确的结果,但需要更长的时间。

8.5.2. stats-count

对与谓词匹配的要素进行计数。

论据

描述

-c, --catalog *

包含架构元数据的目录表

-f, --feature-name *

架构的名称

-q, --cql

用于选择要导出的要素的CQL过滤器

--no-cache

不使用缓存的统计数据

默认情况下,预计算(缓存)统计数据将用于估计计数。缓存的统计数据可能不完全准确,但可以立即使用。如果 --no-cache 参数,则将通过对数据运行查询来计算计数。这将给出准确的结果,但需要更长的时间。

8.5.3. stats-histogram

显示给定属性的值的直方图。

论据

描述

-c, --catalog *

包含架构元数据的目录表

-f, --feature-name *

架构的名称

-q, --cql

用于选择要导出的要素的CQL过滤器

-a, --attributes

要计算值的特定属性

--bins

用于划分直方图值的条件数

--no-cache

不使用缓存的统计数据

这个 --bins 参数将决定直方图的划分方式。例如,在检查一周的时间数据时,使用7个箱将按天对值进行分组。

默认情况下,预计算(缓存)统计信息将用于估计直方图。缓存的统计数据可能不完全准确,但可以立即使用。如果 --no-cache 参数,则将通过对数据运行查询来计算直方图。这将给出准确的结果,但需要更长的时间。请注意,即使使用 --no-cache ,摘要统计模型用于确定直方图,它们可能不完全准确。

几何体类型属性上的直方图将显示为粗略热图。

8.5.4. stats-top-k

显示给定属性的最常见值。

论据

描述

-c, --catalog *

包含架构元数据的目录表

-f, --feature-name *

架构的名称

-q, --cql

用于选择要导出的要素的CQL过滤器

-a, --attributes

要计算值的特定属性

-k

要显示的最大值数

--no-cache

不使用缓存的统计数据

默认情况下,预计算(缓存)统计数据将用于估计最高值。缓存的统计数据可能不完全准确,但可以立即使用。如果 --no-cache 参数,则将通过对数据运行查询来计算顶值。这将给出准确的结果,但需要更长的时间。请注意,即使使用 --no-cache ,摘要统计模型用于确定顶值,它们可能不完全准确。