打印质量控制指标

从2.4.0版开始,Plotfingerprint可以选择输出一些有助于解释指纹图的指标。这些度量中的许多需要匹配的输入样本,可以通过以下方式指定 --JSDsample .

序列深度依赖性

除了“合成JS距离”,所有质量控制度量的一个重要警告是,排序深度在良好值的背景假设中起着滚动作用。下面直观地演示了这一点,其中不同的曲线表示在不同的平均排序深度(“lambda”)下,一个行为完美的输入样本应该是什么样的。

../../_images/plotFingerprintQC2.png

该图相当于 plotFingerprint ,轴标记不同。注意,对于低覆盖率,背景期望值不是从左下到右上的对角线,而是凸曲线,或者在非常低的覆盖率下,是具有给定x轴截距的直线。因此,为每个样本生成了许多“合成”度量。这些表示与上面类似的人工绘图输入打印结果的度量。这些对于将您观察到的样本结果透视起来很有用。例如,如果由于序列深度较低,预计输入样本的肘部点为0.85,那么芯片样本的肘部点0.95可能不会那么令人印象深刻。

指标

备注

有许多质量控制指标,其中我们发现“JS距离”最有用!

  • AUC:曲线下面积,最大值为0.5。较低的值通常表示更高和更多的焦点富集。

../../_images/plotFingerprintQC1.png
  • 合成AUC:具有相同给定样本平均测序深度的完美输入样本曲线下的预期面积。这有助于透视观察到的AUC。

  • X轴截距:曲线不是0的点(在X轴上)。这大约是特定样本中未测序的基因组百分比。理想情况下,该值将接近0。然而,在实践中,这可能相当高,因为诸如低序列深度(见上文)或极高的浓缩度导致峰值吸收所有可用的读取。

  • 合成X截距:具有相同给定样本平均测序深度的完美输入样本的预期X截距。这对于透视观察到的X轴截距很有用。

  • 肘点:肘点试图测量直线向上旋转的位置。在实践中,这是绘制线最远离从图形左下角到右上角的线的点(相当于具有无限覆盖的完美输入样本)。返回的点是该肘关节点X轴上的位置,较高的值表示更丰富。

  • 合成肘点:具有相同给定样本平均序列深度的完美输入样本的预期肘点。这对于透视观察到的肘关节点很有用。

  • JS距离:这是给定样本与指定样本之间的Jensen-Shannon距离。 --JSDsample 基于Sitanshu Gakkhar的工作。詹森-香农分歧定义如下:

\[\开始{align}\]

在这里, D 是Kullback-Leibler的分歧。 PQ 是图中直线的概率质量函数。JS距离是上述JS散度的平方根。较高的值表示两条曲线之间的差异较大,最小值和最大值分别为0和1。

  • 合成JS距离:如上图所示,完美输入样本的预期分布取决于其排序深度,这意味着如果样本及其匹配控件的深度非常不同,那么它们之间的JS距离是误导性的。因此,该指标不显示两个样本之间的JS距离,而是显示给定样本与具有相同覆盖深度的完美输入样本之间的JS距离(即,由lambda等于t中平均覆盖率的泊松概率质量函数生成的图)。他采样)。理想情况下,此度量与上面的度量非常相似,但如果排序深度非常不同(在这种情况下,此度量可能更可靠),则可能不会。还请注意,此度量甚至打印在 --JSDsample 选项,这对评估输入样本中存在的偏差水平很有用,理想情况下,它应该具有泊松分布覆盖范围。

  • %基因组丰富:这是源于 CHANCE 工具。这是通过首先找到肘点(基本上如上所述)然后计算1减去该点来计算的。这表示基因组中信号丰富的大约百分比(例如,受转录因子约束或具有特定组蛋白修饰)。

  • 差异富集:给定样品与指示样品之间的差异富集 --JSDsample 在肘部。这也是Chance工具引入的度量标准。较高的百分比通常更好。

  • CHANCE divergence: The divergence metric introduced by the CHANCE tools (and seemingly undocumented). In many ways, this is similar to the JS distance metric. The computation starts with the values at the elbow point of a given sample (P) and the sample given by --JSDsample (Q). Given P and Q, the "CHANCE divergence" is calculated as follows:

\[\开始{align}\]

这个 binRelEntropy 函数类似于二元熵和库尔贝克-莱布勒散度的混合物。注意,如果 X 是0, X * log2(X/Y) 是0。同样,如果 X 是1,那么 (1 - X) * log2((1 - X) / (1 - Y)) 是0。

deepTools Galaxy <http://deeptools.ie-freiburg.mpg.de> _.

code @ github <https://github.com/deeptools/deepTools/> _.