工具

工具

类型

输入文件

主输出文件

应用

多BAM摘要

数据集成

2个或更多BAM

基于间隔的值表

对读取计数执行交叉采样分析——>plotcorrelation,plotpca

多大人物概要

数据集成

2个或更多大人物

基于间隔的值表

对全基因组评分进行交叉样本分析——>plotcorrelation,plotpca

普洛相关

可视化

BAM/MultiBigWigSummary输出

聚集热图

可视化皮尔逊/斯皮尔曼相关性

普洛普卡

可视化

BAM/MultiBigWigSummary输出

2个PCA图

可视化主成分分析

绘图针打印

QC

2巴姆

1诊断图

评估芯片样品的富集强度

计算能力

QC

1巴姆

2诊断图

计算exp.和obs。读取的GC分布

纠正偏差

QC

1个BAM,从ComputegCBias输出

1个GC校正的BAM

获取一个根据基因组GC含量分布的读取数据的BAM文件

BAM覆盖范围

标准化

BAM

卧床或大人物

获取单个BAM文件的规范化读取覆盖率

BAM比较

标准化

2巴姆

卧床或大人物

相互规范化2个文件(例如log2ratio、difference)

计算机

数据集成

一个或多个大人物,一张或多张床

plotaMap或plotprofile的压缩文件

计算热图和汇总图所需的值

估计自适应滤波

信息

1个或多个BAM文件

价值表

估计从一个或多个BAM文件筛选的读取数

对齐筛选

QC

1个BAM文件

1个已筛选的BAM或BEDPE文件

基于一个或多个条件筛选BAM文件

地图

可视化

ComputeMatrix输出

阅读封面热图

可视化基因组区域的阅读覆盖率

绘图配置文件

可视化

ComputeMatrix输出

汇总图(“meta profile”)

可视化一组基因组区域的平均读取覆盖率

绘图平均值

可视化

一个或多个BAM

2诊断图

将样本基因组位置的平均读取覆盖率可视化

Bampe碎片大小

信息

1巴姆

具有成对结束片段长度的文本

从成对的末端获取平均片段长度

丰富度

可视化

1个或多个BAM和1个或多个BED/GTF

诊断图

绘制与给定特征重叠的路线分数

计算机业务

其他

1个或多个BAM和1个或多个BED/GTF

诊断图

绘制与给定特征重叠的路线分数

一般原则

典型的deeptools命令可能如下所示:

$ bamCoverage --bam myAlignedReads.bam \
--outFileName myCoverageFile.bigWig \
--outFileFormat bigwig \
--fragmentLength 200 \
--ignoreDuplicates \
--scaleFactor 0.5

您始终可以通过--Help或-h查看所有可用的命令行选项:

$ bamCoverage --help
$ bamCoverage -h

通过运行不带任何参数的命令,可以显示最小的用法示例:

$ bamCoverage
  • 绘图的输出格式应以文件结尾表示,例如 MyPlot.pdf 将返回一个PDF文件, MyPlot.png PNG文件

  • 所有生成绘图的工具也可以输出基础数据-这在您不喜欢Deeptools可视化的情况下很有用,因为您可以使用Deeptools生成的数据矩阵和您最喜欢的绘图工具,如R

  • 绝大多数命令行选项在Galaxy中也可用(在少数情况下,它们的命名会有细微的更改)。

减少运行时间的参数

  • numberOfProcessors -要使用的处理器数量

例如,设置 --numberOfProcessors 10 将在内部将工作负载拆分为10个块,这些块将并行处理。请注意,对于高度碎片化的程序集(>1000个重叠群),运行时间会急剧增加。在这种情况下,考虑只包括规范染色体。

  • region -只处理一个基因组区域。

当您仍在尝试确定最佳参数设置时,这尤其有用。你可以通过设置,例如, --region chr2--region chr2:100000-200000

这两个参数都是可选的,几乎在所有DeepTool中都可用。

处理时过滤BAM

几个deeptools模块允许高效地处理BAM文件,例如 bamCoveragebamCompare . 我们提供了几种实时过滤这些BAM文件的方法,这样您就不需要使用其他工具(如 samtools

  • ignoreDuplicates

    具有相同方向和起始位置的读取将只考虑一次。如果读取是成对的,则对配对也进行评估。

  • minMappingQuality

    只考虑映射质量分数至少为该分数的读取

  • samFlagInclude

    包括基于SAM标志的读取,例如 --samFlagInclude 64 获取一对中第一个的读取。要将Sam Flags翻译为英语,请转到: https://broadinstitute.github.io/picard/explain-flags.html

  • ` samFlagExclude`

    排除基于SAM标志的读取-请参阅前面的解释。

这些参数是可选的,在整个deeptools中都可用。

备注

在2.3版中,我们引入了一种抽样方法,在使用 bamCoveragebamCompare . 对于以前的版本,如果您知道筛选重复或低质量的读取会严重影响您的文件,请考虑删除这些读取 之前 使用 bamCoveragebamCompare 当Deeptools过滤完成时 之后 计算比例因子!

用于BAM和Bigwig文件处理的工具

多BAM摘要

多大人物概要

纠正偏差

BAM覆盖范围

BAM比较

大人物比较

大人物平均

计算机

对齐筛选

质量控制工具

普洛相关

普洛普卡

绘图针打印

Bampe碎片大小

计算能力

绘图平均值

热图和汇总图

地图

绘图配置文件

丰富度

其他

计算机业务

估计自适应滤波

deepTools Galaxy <http://deeptools.ie-freiburg.mpg.de> _.

code @ github <https://github.com/deeptools/deepTools/> _.