摘要#

图摘要可以找到更小的图表示形式,从而加快算法运行时间、减少存储需求并降低噪声。摘要在可视化、模式挖掘、聚类和社区检测等领域都有应用。核心的图形摘要技术是分组/聚合、比特压缩、简化/稀疏和基于影响。图摘要算法通常以超图或稀疏图的形式生成摘要图,或者生成独立结构的列表。超图是最常见的乘积,它由超节点和原始节点组成,由边和超边连接,边和超边代表节点和超节点之间的聚合边。

基于分组/聚集的技术通过用超图中的单个节点/边来表示图中的紧密/连通节点和边来压缩图。节点可以根据它们在图中的结构相似性或邻近程度一起分组为超节点,以减少图中的节点总数。边分组技术将边分组为称为压缩器或虚拟节点的有损/无损节点,以减少图中的边总数。边分组技术可以是无损的,这意味着它们可以用于重新创建原始图形,或者技术可能是有损的,需要较少的空间来存储汇总图形,但代价是原始图形的重构精度较低。

位压缩技术最大限度地减少了描述原始图形所需的信息量,同时揭示了原始图形中的结构模式。两部分最小描述长度(MDL)通常用来表示模型和用模型表示的原始图。图形压缩和图形汇总之间的关键区别在于,图形汇总侧重于在原始图形中发现结构模式,而图形压缩侧重于将原始图形压缩得尽可能小。 NOTE :有些比特压缩方法仅用于压缩图形,而不创建摘要图或找到可理解的结构模式。

简化/稀疏技术试图通过从图中移除不重要的节点和边来创建图的稀疏表示。稀疏图不同于通过分组/聚集创建的超图,因为它只包含原始图的原始节点和边的子集。

基于影响的技术旨在找到大图中影响传播的高层次描述。这些方法很少,而且大多应用于社交图。

dedensification is a grouping/aggregation based technique to compress the neighborhoods around high-degree nodes in unweighted graphs by adding compressor nodes that summarize multiple edges of the same type to high-degree nodes (nodes with a degree greater than a given threshold). Dedensification was developed for the purpose of increasing performance of query processing around high-degree nodes in graph databases and enables direct operations on the compressed graph. The structural patterns surrounding high-degree nodes in the original is preserved while using fewer edges and adding a small number of compressor nodes. The degree of nodes present in the original graph is also preserved. The current implementation of dedensification supports graphs with one edge type.

有关图形汇总的更多信息,请参见 Graph Summarization Methods and Applications: A Survey

dedensify(G, threshold[, prefix, copy])

压缩高度节点周围的邻域

snap_aggregation(G, node_attributes[, ...])

基于属性和连接性创建摘要图。