工具
工具 |
类型 |
输入文件 |
主输出文件 |
应用 |
---|---|---|---|---|
数据集成 |
2个或更多BAM |
基于间隔的值表 |
对读取计数执行交叉采样分析——>plotcorrelation,plotpca |
|
数据集成 |
2个或更多大人物 |
基于间隔的值表 |
对全基因组评分进行交叉样本分析——>plotcorrelation,plotpca |
|
可视化 |
BAM/MultiBigWigSummary输出 |
聚集热图 |
可视化皮尔逊/斯皮尔曼相关性 |
|
可视化 |
BAM/MultiBigWigSummary输出 |
2个PCA图 |
可视化主成分分析 |
|
QC |
2巴姆 |
1诊断图 |
评估芯片样品的富集强度 |
|
QC |
1巴姆 |
2诊断图 |
计算exp.和obs。读取的GC分布 |
|
QC |
1个BAM,从ComputegCBias输出 |
1个GC校正的BAM |
获取一个根据基因组GC含量分布的读取数据的BAM文件 |
|
标准化 |
BAM |
卧床或大人物 |
获取单个BAM文件的规范化读取覆盖率 |
|
标准化 |
2巴姆 |
卧床或大人物 |
相互规范化2个文件(例如log2ratio、difference) |
|
数据集成 |
一个或多个大人物,一张或多张床 |
plotaMap或plotprofile的压缩文件 |
计算热图和汇总图所需的值 |
|
信息 |
1个或多个BAM文件 |
价值表 |
估计从一个或多个BAM文件筛选的读取数 |
|
QC |
1个BAM文件 |
1个已筛选的BAM或BEDPE文件 |
基于一个或多个条件筛选BAM文件 |
|
可视化 |
ComputeMatrix输出 |
阅读封面热图 |
可视化基因组区域的阅读覆盖率 |
|
可视化 |
ComputeMatrix输出 |
汇总图(“meta profile”) |
可视化一组基因组区域的平均读取覆盖率 |
|
可视化 |
一个或多个BAM |
2诊断图 |
将样本基因组位置的平均读取覆盖率可视化 |
|
信息 |
1巴姆 |
具有成对结束片段长度的文本 |
从成对的末端获取平均片段长度 |
|
可视化 |
1个或多个BAM和1个或多个BED/GTF |
诊断图 |
绘制与给定特征重叠的路线分数 |
|
其他 |
1个或多个BAM和1个或多个BED/GTF |
诊断图 |
绘制与给定特征重叠的路线分数 |
一般原则
典型的deeptools命令可能如下所示:
$ bamCoverage --bam myAlignedReads.bam \
--outFileName myCoverageFile.bigWig \
--outFileFormat bigwig \
--fragmentLength 200 \
--ignoreDuplicates \
--scaleFactor 0.5
您始终可以通过--Help或-h查看所有可用的命令行选项:
$ bamCoverage --help
$ bamCoverage -h
通过运行不带任何参数的命令,可以显示最小的用法示例:
$ bamCoverage
绘图的输出格式应以文件结尾表示,例如
MyPlot.pdf
将返回一个PDF文件,MyPlot.png
PNG文件所有生成绘图的工具也可以输出基础数据-这在您不喜欢Deeptools可视化的情况下很有用,因为您可以使用Deeptools生成的数据矩阵和您最喜欢的绘图工具,如R
绝大多数命令行选项在Galaxy中也可用(在少数情况下,它们的命名会有细微的更改)。
减少运行时间的参数
numberOfProcessors
-要使用的处理器数量
例如,设置 --numberOfProcessors 10
将在内部将工作负载拆分为10个块,这些块将并行处理。请注意,对于高度碎片化的程序集(>1000个重叠群),运行时间会急剧增加。在这种情况下,考虑只包括规范染色体。
region
-只处理一个基因组区域。
当您仍在尝试确定最佳参数设置时,这尤其有用。你可以通过设置,例如, --region chr2
或 --region chr2:100000-200000
这两个参数都是可选的,几乎在所有DeepTool中都可用。
处理时过滤BAM
几个deeptools模块允许高效地处理BAM文件,例如 bamCoverage
和 bamCompare
. 我们提供了几种实时过滤这些BAM文件的方法,这样您就不需要使用其他工具(如 samtools
ignoreDuplicates
具有相同方向和起始位置的读取将只考虑一次。如果读取是成对的,则对配对也进行评估。
minMappingQuality
只考虑映射质量分数至少为该分数的读取
samFlagInclude
包括基于SAM标志的读取,例如
--samFlagInclude 64
获取一对中第一个的读取。要将Sam Flags翻译为英语,请转到: https://broadinstitute.github.io/picard/explain-flags.html
- ` samFlagExclude`
排除基于SAM标志的读取-请参阅前面的解释。
这些参数是可选的,在整个deeptools中都可用。
备注
在2.3版中,我们引入了一种抽样方法,在使用 bamCoverage
或 bamCompare
. 对于以前的版本,如果您知道筛选重复或低质量的读取会严重影响您的文件,请考虑删除这些读取 之前 使用 bamCoverage
或 bamCompare
当Deeptools过滤完成时 之后 计算比例因子!
用于BAM和Bigwig文件处理的工具
多BAM摘要
多大人物概要
纠正偏差
BAM覆盖范围
BAM比较
大人物比较
大人物平均
计算机
对齐筛选
质量控制工具
普洛相关
普洛普卡
绘图针打印
Bampe碎片大小
计算能力
绘图平均值
热图和汇总图
地图
绘图配置文件
丰富度
其他
计算机业务
估计自适应滤波
deepTools Galaxy <http://deeptools.ie-freiburg.mpg.de> _. |
code @ github <https://github.com/deeptools/deepTools/> _. |