逐步协议

本节将概述如何执行许多常见任务。我们正在使用 Galaxy的截图 在这里。如果您使用的是命令行版本，那么您可以很容易地遵循给定的示例，因为绝大多数参数也会在Galaxy中显示。否则，只需键入程序名和帮助选项（例如 /deepTools/bin/bamCoverage --help ，这将显示所有可用的参数和选项。或者，您可以按照阅读docs上的工具文档的相应链接进行操作。

备注

如需支持或问题，请发帖至 Biostars . 对于错误报告和功能请求，请打开问题 <on github .

所有协议都假定您已将文件上载到安装了deeptools的Galaxy实例中，例如， deepTools Galaxy . 如果您需要帮助才能开始使用Galaxy，例如上传数据，请参见在Galaxy中使用deepTool 和数据导入Galaxy .

小技巧

如果您想尝试使用 样本数据 去 deepTools Galaxy -->“共享数据”-->“数据库”-->“Deeptools测试文件”。只需选择bed/bam/bigwig文件并单击“to history”。您也可以通过单击顶部的“下载”将测试数据集下载到您的计算机。

质量控制和数据处理 

我已经下载/接收了一个BAM文件-如何生成一个我可以在基因组浏览器中查看的文件？

工具： BAM覆盖范围
输入：您的 BAM 具有对齐读取的文件

当然，你也可以在基因组浏览器中查看你的BAM文件。但是，生成一个读覆盖率较大的文件将大大减小文件的大小，它还允许您将覆盖率规范化为1X序列深度，这使得对多个文件进行可视化比较更加可行。

通常，您会对不同副本和不同样本的读取覆盖率的相关性感兴趣。你想看到的是，复制应该比不复制更好地相互关联。这个 ENCODE consortium recommends 那个 [for messenger RNA, (...) biological replicates [should] display 0.9 correlation for transcripts/features] . 有关相关性计算的详细信息，请参见普洛相关 .

工具：多BAM摘要然后普洛相关
输入：BAM文件
- 您可以根据需要比较任意多的样本，但使用的越多，计算所需的时间就越长。

小技巧

如果要基于bigwig文件进行类似的分析，请使用该工具 multiBigwigSummary 相反。

我如何知道我的样本是否偏向GC？如果是的话，我该怎么纠正呢？

输入： BAM 文件
使用工具计算能力在该BAM文件上（默认设置，仅 确保你的参考基因组和基因组大小相匹配。 ）

查看生成的图像并将其与示例进行比较 here
如果您的样本显示exp/obs覆盖率几乎呈线性增长（在下图的对数尺度上），那么您应该考虑纠正gc偏差。- if 您认为该数据的生物学解释可能会受到影响（例如，将其与另一个没有固有GC偏差的样品进行比较）。
- GC偏差可以用工具纠正。纠正偏差使用必须运行的computegbias工具的第二个输出

警告

correctGCbias 将向其他耗尽的区域（通常是GC不良区域）添加读取，这意味着您应该 not 根据GC更正的BAM文件删除任何下游分析中的重复项。因此，我们建议在进行更正之前删除重复项，以便只保留由GC更正过程生成的那些重复读取。

如何获得输入规范化的chip seq覆盖文件？

输入：您需要两个BAM文件，一个用于输入，一个用于chip seq实验
工具： BAM比较芯片=处理，输入=控制样本

如何比较不同芯片实验的芯片强度？

工具：绘图针打印
输入：要比较的任意多个chip seq样本的BAM文件（包含输入控件有助于查看希望的非强化样本是什么样子的）

小技巧

有关绘图解释的更多详细信息，请参见绘图针打印或者选择Deeptools星系中的工具并向下滚动以获取更多信息。

热图和汇总图 

如何获得（聚集的）序列深度热图？所有基因转录起始位点周围的标准化读取覆盖率？

工具：计算机然后地图
输入：
- 1 大人物规范化读取覆盖率的文件（例如 BAM覆盖范围或 BAM比较）
- 1 BED 或基因的间隔文件，例如通过“获取数据”-->“UCSC主表浏览器”-->组：“基因和基因预测”-->（例如，“refseqgenes”-->发送到Galaxy（参见下面的屏幕截图）

使用计算机用大人物档案和床上档案
表明 reference-point （无论您想调优其他选项，请参见下面的屏幕截图）

使用来自的输出计算机具有地图
- 如果要对信号进行群集，请选择 k-means clustering （高级选项的最后一个选项），具有合理数量的集群（通常在2到7之间）

如何比较2个或更多不同测序实验中X特异基因和常染色体基因的平均信号？

在使用此协议之前，请确保您熟悉ComputeMatrix和PlotProfile。

工具：
- 使用简单表达式筛选任何列上的数据
- 计算机
- 绘图配置文件
- （绘制多个样本的汇总图）
输入：
- 几个bigwig文件（您要比较的每个测序实验一个）
- 两个床文件，一个带有X染色体，一个带有常染色体基因

如何获取每个X染色体和常染色体基因的床文件 

通过“获取数据”-->“UCSC主表浏览器”-->组：“基因和基因预测”-->跟踪（例如，“refseqgenes”-->发送到Galaxy）下载完整的基因列表
使用工具筛选列表两次 “使用简单表达式筛选任何列上的数据”
- 首先使用表达式：c1==“chrx”过滤所有基因的列表——>这将生成一个X连锁基因的列表。
- 然后重新运行过滤，现在使用c1！=“chrx”，它将生成一个不属于X染色体的基因列表（！=表示“不匹配”）

计算X和常染色体基因的平均值 

使用计算机对于所有信号文件（bigwig格式）
- 提供两个过滤床文件（单击一次“添加要绘制的新区域”）并标记它们
- 指示相应的信号文件
现在使用绘图配置文件在结果文件上
- 重要提示：显示“高级输出选项”并选择“保存平均配置文件下的数据”-->这将生成一个表以及摘要绘图图像

deepTools Galaxy <http://deeptools.ie-freiburg.mpg.de> _.

code @ github <https://github.com/deeptools/deepTools/> _.