Bio.Phylo.Applications软件包

模块内容

系统发育命令行工具包装器(过时)。

我们已经决定在将来删除此模块,建议您构建命令并直接通过子进程模块调用它。

class Bio.Phylo.Applications.PhymlCommandline(cmd='phyml', **kwargs)

基类:AbstractCommandline

树推理程序PhyML的命令行包装器。

主页:http://www.atgc-montpellier.fr/phyml

参考文献

用最大似然法估计大型系统发育的一种简单、快速和准确的算法。“系统生物学”,2003年10月;52(5):696-704。PubMed PMID:14530136。

Guindon S,Dufayard JF,Lefort V,Anisimova M,Hordijk W,Gascuel O。估计最大似然系统发育的新算法和方法:评估PhyML 3.0的性能。系统生物学,2010 59(3):307-21。

__init__(cmd='phyml', **kwargs)

初始化类。

property alpha

伽马分布形状参数的分布。

可以是固定的正值,也可以是‘e’以获得最大似然估计。

这控制-a参数及其关联值的添加。将此属性设置为所需的参数值。

property bootstrap

如果值>0,则引导复制数。

否则:

0:既不计算近似似然比检验,也不计算自举值。

-1:返回ALRT统计的近似似然比测试。

-2:近似似然比测试返回基于Chi2的参数分支支持。

-4:SH形树枝单独支撑。

这控制-b参数及其关联值的添加。将此属性设置为所需的参数值。

property datatype

数据类型‘NT’代表核苷酸(默认)或‘AA’代表氨基酸。

这控制-d参数及其关联值的添加。将此属性设置为所需的参数值。

property frequencies

字符频率。

-f e、m或“FA FC FG FT”

E:经验频率,确定如下:

  • 核苷酸序列:(经验性的)平衡碱基频率是通过计算比对中不同碱基的出现次数来估计的。

  • 氨基酸序列:(经验)通过计算不同氨基酸在比对中的出现次数来估计平衡的氨基酸频率。

基于m:ml/型号的频率,确定如下:

  • 核苷酸序列:(Ml)使用最大似然法估计平衡碱基频率

  • 氨基酸序列:(模型)用取代模型定义的频率估计平衡氨基酸的频率。

“FA FC FG FT”:仅适用于基于核苷酸的模型。FA、FC、FG和FT是分别对应于A、C、G和T的频率的浮点数。

这控制-f参数及其关联值的添加。将此属性设置为所需的参数值。

property input

PHYLIP格式输入核苷酸或氨基酸序列文件名。

这控制-i参数及其关联值的添加。将此属性设置为所需的参数值。

property input_tree

启动树文件名。树必须为Newick格式。

这控制-u参数及其关联值的添加。将此属性设置为所需的参数值。

property model

替代模型名称。

基于核苷酸的模型:

HKY85(默认)|JC69|K80|F81|F84|TN93|GTR|自定义

对于自定义选项,六位数字的字符串标识型号。例如,000000对应于F81(或JC69,只要核苷酸频率分布是均匀的)。012345相当于gtr。此选项可用于对嵌套在GTR中的任何模型进行编码。

以氨基酸为基础的模型:

LG(默认)|WAG|jtt|MtREV|Dayhoff|DCMut|RtREV|CpREV|VT|Blosum62|MtMam|MtArt|HIVw|HIVb|CUSTOM

这控制-m参数及其关联值的添加。将此属性设置为所需的参数值。

property multiple

要分析的数据集的数量(整数)。

这控制-n参数及其关联值的添加。将此属性设置为所需的参数值。

property n_rand_starts

要使用的初始随机树的数量。

仅当要执行SPR搜索时才有效。

这控制--n_rand_start参数及其关联值的添加。将此属性设置为所需的参数值。

property nclasses

相对替代率类别数。

默认值1。必须是正整数。

这控制-c参数及其关联值的添加。将此属性设置为所需的参数值。

property optimize

具体参数优化。

TLR:优化树形拓扑(T)、分支长度(L)和速率参数(R)。

TL:优化了树形拓扑和分支长度。

LR:优化了分支长度和速率参数。

L:分支长度已优化。

R:优化了速率参数。

N:未优化任何参数。

这控制-o参数及其关联值的添加。将此属性设置为所需的参数值。

property pars

使用最小简约起始树。

当没有‘-u’选项并且要进行树拓扑修改时,会考虑此选项。

此属性控制-p开关的添加,将此属性视为布尔值。

property print_site_lnl

打印文件*_phyml_lk.txt中每个站点的可能性。

此属性控制--PRINT_SITE_LNL开关的添加,将此属性视为布尔值。

property print_trace

在文件*_phyml_trace.txt中打印在树搜索过程中探索的每个系统发育。

此属性控制--print_trace开关的添加,将此属性视为布尔值。

property prop_invar

固定位置的比例。

可以是范围内的固定值 [0,1] ,或“e”以获得最大似然估计。

这控制-v参数及其关联值的添加。将此属性设置为所需的参数值。

property quiet

没有交互式问题(用于在批处理模式下运行)。

此属性控制--Quiet开关的添加,将此属性视为布尔值。

property r_seed

用于启动随机数生成器的种子。

必须是整数。

这控制--r_Seed参数及其关联值的添加。将此属性设置为所需的参数值。

property rand_start

将初始树设置为随机。

仅当要执行SPR搜索时才有效。

此属性控制--rand_start开关的添加,将此属性视为布尔值。

property run_id

在每个PhyML输出文件的末尾追加给定的字符串。

此选项在运行涉及PhyML的模拟时可能很有用。

这控制--run_id参数及其关联值的添加。将此属性设置为所需的参数值。

property search

树形拓扑搜索操作选项。

可以是以下之一:

NNI:默认、快速

SPR:比NNI慢一点

最佳:NNI和SPR搜索中的最佳

这控制-s参数及其关联值的添加。将此属性设置为所需的参数值。

property sequential

将交错格式(默认)更改为顺序格式。

此属性控制-q开关的添加,将此属性视为布尔值。

property ts_tv_ratio

过渡/横向比率。(仅限DNA序列。)

可以是固定的正值(例如:4.0)或e以获得最大似然估计。

这控制-t参数及其关联值的添加。将此属性设置为所需的参数值。

class Bio.Phylo.Applications.RaxmlCommandline(cmd='raxmlHPC', **kwargs)

基类:AbstractCommandline

树推理程序RAxML的命令行包装器。

所需参数为‘Sequence’(-s)、‘model’(-m)和‘name’(-n)。还必须为raxml设置参数‘parsimonyseed’(-p),但是如果您不指定它,此包装器将为您将种子设置为10000。

参考文献

Stamatakis A.RAxML-VI-HPC:数千个分类群和混合模式的基于最大似然的系统发育分析。生物信息学,2006,22(21):2688-2690。

主页:http://sco.h-its.org/exelixis/software.html

示例

>>> from Bio.Phylo.Applications import RaxmlCommandline
>>> raxml_cline = RaxmlCommandline(sequences="Tests/Phylip/interlaced2.phy",
...                                model="PROTCATWAG", name="interlaced2")
>>> print(raxml_cline)
raxmlHPC -m PROTCATWAG -n interlaced2 -p 10000 -s Tests/Phylip/interlaced2.phy

通常使用raxml_cline()或通过Python子进程模块运行命令行,如Biopython教程中所述。

__init__(cmd='raxmlHPC', **kwargs)

初始化类。

property parsimony_seed

简约推论的随机数种子。这使您可以重现结果,并将帮助开发人员调试程序。此选项在并行MPI版本中无效。

这控制-p参数及其关联值的添加。将此属性设置为所需的参数值。

property algorithm

选择算法:

答:在一次程序运行中快速引导分析和搜索得分最高的ML树。

b:根据‘-z’指定的文件中的多个树(例如,形成引导),在带有‘-t’的树上绘制双分区信息。

C:检查RAxML是否可以正确读取对齐。

D:新的快速爬山(默认)。

E:仅在Gamma/GAMMAI下优化模型+给定输入树的分支长度。

g:计算通过‘-z’传递的一个或多个树的每个站点的日志概率,并将它们写入Consel可以读取的文件。

h:计算通过‘-t’传递的最佳树和通过‘-z’传递的一系列其他树之间的对数似然检验(SH-test)。

I:执行真正彻底的引导,在Gamma下对最终引导树进行精化,以及更详尽的算法。

J:从原始的alignemnt文件生成一组自举的对齐文件。

m:比较分别通过‘-t’和‘-z’传递的两束树之间的两个分区。这将返回在两个树文件中找到的所有双分区之间的Pearson相关性。将打印一个名为RAxML_biartitionFrequencies.outputFileName的文件,该文件包含两个集合的成对双分区频率。

N:计算由Gamma或Gamma+P-Invar下的‘-z’提供的树文件中包含的所有树的对数似然分数。

O:古老而缓慢的快速爬山。

P:对不完整的起始树执行新序列的纯阶梯式MP加法。

S:将多基因分割的比对拆分成各自的亚比对。

T:在一棵固定起始树上进行随机树搜索。

W:计算通过‘-z’的一串树的ELW测试。

X:计算成对ML距离,ML模型参数将在MP起始树或通过‘-t’传递的用户定义树上进行估计,仅允许基于伽马的速率异质性模型。

这控制-f参数及其关联值的添加。将此属性设置为所需的参数值。

property binary_constraint

二进制约束树的文件名。这棵树不需要是全面的,即包含所有的分类单元。

这控制-r参数及其关联值的添加。将此属性设置为所需的参数值。

property bipartition_filename

包含多个树的文件的名称,例如来自引导运行的文件,用于将双分区值绘制到具有‘-t’的树上。它还可以与‘-fg’结合使用来计算每个站点的日志概率,并读取一串树以获得几个其他选项(‘-fh’、‘-fm’、‘-fn’)。

这控制-z参数及其关联值的添加。将此属性设置为所需的参数值。

property bootstrap_branch_lengths

打印带有分支长度的引导树。引导程序将运行更长时间,因为模型参数将在每次运行结束时进行优化。与CATMIX/PROTMIX或GAMMA/GAMMAI配合使用。

此属性控制-k开关的添加,将此属性视为布尔值。

property bootstrap_seed

用于引导的随机种子。

这控制-b参数及其关联值的添加。将此属性设置为所需的参数值。

property checkpoints

写入检查点(中间树拓扑)。

此属性控制-j开关的添加,将此属性视为布尔值。

property cluster_threshold

序列相似性聚类的阈值。然后,RAxML将打印出一个名为SequenceFileName.ReducedBy.Threshold的文件的比对结果,该文件只包含<=指定的阈值,该阈值必须介于0.0和1.0之间。RAxML使用Qt聚类算法来执行此任务。此外,还将写入包含集群信息的名为RAxML_ReducedList.outputFileName的文件。

这控制-l参数及其关联值的添加。将此属性设置为所需的参数值。

property cluster_threshold_fast

功能与‘-l’相同,但使用的群集算法不那么详尽,因此速度更快。这适用于包含超过20,000-30,000个序列的超大型数据集。

这控制-L参数及其关联值的添加。将此属性设置为所需的参数值。

property epsilon

在MIX/MIXI或GAMMAI/GAMMAI下设置最终优化树形拓扑的模型优化精度(对数似然单位),默认值:不使用不变点比例估计的模型为0.1%;使用不变点比例估计的模型为0.001。

这控制-e参数及其关联值的添加。将此属性设置为所需的参数值。

property exclude_filename

排除文件名,包含要排除的对齐位置的规范。格式类似于Nexus,文件应包含类似于‘100-200,300-400’的条目;以排除单列写入,例如,‘100-100’。如果您使用混合模型,则会编写一个适当调整的模型文件。

这控制-E参数及其关联值的添加。将此属性设置为所需的参数值。

property grouping_constraint

多分支约束树的文件名。这棵树不需要是全面的,即包含所有的分类单元。

这控制-g参数及其关联值的添加。将此属性设置为所需的参数值。

property model

核苷酸或氨基酸替代模型:

核苷酸:

GTRCAT:GTR+替换率的优化+站点特定进化速率的优化(分类为number OfCategories不同的速率类别以获得更高的计算效率)如果您使用‘-#’或‘-N’进行多重分析,但没有自举,则程序将改用GTRMIX

GTRGAMMA:GTR+替代率优化+异质性伽马模型(α参数将被估计)

GTRMIX:在GTRCAT下推断树,然后在GTRGAMMA下评估最终的树拓扑

GTRCAT_GAMMA:用特定于站点的进化率推断树。然而,这里的速率是使用4个离散伽马率进行分类的。GTRGAMMA下最终树形拓扑的评估

GTRGAMMAI:与GTRGAMMA相同,但估计了不变位点的比例

GTRMIXI:与GTRMIX相同,但估计了不变位点的比例

GTRCAT_GAMMAI:与GTRCAT_GAMMAI相同,但估计了不变位点的比例

氨基酸:

PROTCATmatrixName [F] :指定的AA矩阵+替换率的优化+站点特定进化速率的优化,这些速率被分类为number OfCategories不同的速率类别,以获得更高的计算效率如果您使用‘-#’或‘-N’进行多重分析,但没有自举,程序将使用PROTMIX.取而代之的是

PROTGAMMAmatrixName [F] :指定AA矩阵+替代率优化+异构率Gamma模型(α参数估计)

PROTMIXmatrixName [F] :在指定的AA矩阵+CAT下推断树,然后在指定的AA矩阵+Gamma下评估最终的树拓扑

PROTCAT_GAMMAmatrixName [F] :在指定的AA矩阵和特定地点的进化率下推断树。然而,这里的速率是使用4个离散伽马率进行分类的。指定AA矩阵+Gamma下的最终树拓扑评估

PROTGAMMAImatrixName [F] :与PROTGAMMAmatrixName相同 [F] ,但估计了不变站点的比例

PROTMIXImatrixName [F] :与PROTMIXmatrixName相同 [F] ,但估计了不变站点的比例

PROTCAT_GAMMAImatrixName [F] :与PROTCAT_GAMMAmatrixName相同 [F] ,但估计了不变站点的比例

可用的AA替代模型:Dayhoff、DCMUT、JTT、MTREV、WAG、RTREV、CPREV、VT、BLOSUM62、MTMAM、GTR带有可选的‘F’附录,您可以指定是否要使用经验基频请不要使用混合模型的经验基频。此外,您还可以在混合模型文件中指定每个基因的AA模型(有关详细信息,请参阅手册)

这控制-m参数及其关联值的添加。将此属性设置为所需的参数值。

property name

输出文件中使用的名称。

这控制-n参数及其关联值的添加。将此属性设置为所需的参数值。

property num_bootstrap_searches

每次复制的多个引导数据库搜索数。使用此选项可以为每个复制获得更好的ML树。默认值:每个引导复制1 ML搜索。

这控制-u参数及其关联值的添加。将此属性设置为所需的参数值。

property num_categories

当演进模型设置为GTRCAT或GTRMIX时,RAxML的不同费率类别的数量。每个站点的单个费率被分类到如此多的费率类别中,以加快计算速度。默认值:25。

这控制-c参数及其关联值的添加。将此属性设置为所需的参数值。

property num_replicates

不同起始树上的备选运行数。与‘-b’选项结合使用,这将调用多重引导分析。默认:1个单一分析。请注意,由于‘-#’有时会导致某些mpi作业深渊翻滚系统出现问题,因此添加了‘-N’作为备选,因为‘-#’通常用于开始评论。

这控制-N参数及其关联值的添加。将此属性设置为所需的参数值。

property outgroup

单个外组的名称或外组的逗号分隔列表,例如‘-o鼠’或‘-o鼠,鼠’。如果多个外群不是单系的,则列表中的第一个名字将被选为外群。分类单元名称之间不要留空格!

这控制-o参数及其关联值的添加。将此属性设置为所需的参数值。

property parsimony

只计算简约起始树,然后退出。

此属性控制-y开关的添加,将此属性视为布尔值。

property partition_branch_lengths

打开对每个分区的单个分支长度的估计。仅当与‘PARTITION_FILENAME’(‘-q’)组合使用时才有效。各个分区的分支长度将打印到单独的文件中。通过使用相应的分区长度来计算分支长度的加权平均值。

此属性控制-M开关的添加,将此属性视为布尔值。

property partition_filename

包含将模型分配给多个替换模型的对齐分区的文件名。有关此文件的语法,请参阅RAxML手册。

这控制-q参数及其关联值的添加。将此属性设置为所需的参数值。

property protein_model

用户定义的AA(蛋白质)替代模型的文件名。该文件必须包含420个条目,前400个条目是AA替换率(这必须是对称矩阵),后20个条目是经验基准频率。

这控制-P参数及其关联值的添加。将此属性设置为所需的参数值。

property random_starting_tree

从随机起始树开始ML优化。

此属性控制-d开关的添加,将此属性视为布尔值。

property rapid_bootstrap_seed

用于快速引导的随机种子。

这控制-x参数及其关联值的添加。将此属性设置为所需的参数值。

property rearrangements

拓扑变化阶段后续应用的初始重排设置。

这控制-i参数及其关联值的添加。将此属性设置为所需的参数值。

property sequences

路线数据文件的名称,采用PHYLIP格式。

这控制-s参数及其关联值的添加。将此属性设置为所需的参数值。

property starting_tree

用户启动树的文件名,采用Newick格式。

这控制-t参数及其关联值的添加。将此属性设置为所需的参数值。

property threads

要运行的线程数。仅限PTHREADS版本!请确保将其设置为您计算机上的最多CPU数量,否则,性能将会大幅下降!

这控制-T参数及其关联值的添加。将此属性设置为所需的参数值。

property version

显示版本信息。

此属性控制-v开关的添加,将此属性视为布尔值。

property weight_filename

要为路线的每一列指定单独权重的列权重文件的名称。这些权重必须是由单独文件中的任意类型和数量的空格分隔的整数。

这控制-a参数及其关联值的添加。将此属性设置为所需的参数值。

property working_dir

RAxML将在其中写入其输出文件的工作目录的名称。默认值:当前目录。

这控制-w参数及其关联值的添加。将此属性设置为所需的参数值。

class Bio.Phylo.Applications.FastTreeCommandline(cmd='fasttree', **kwargs)

基类:AbstractCommandline

FastTree的命令行包装器。

只有 inputout 参数是必需的。

从终端命令行使用 fasttree.exe -helpfasttree.exe -expert 有关用法选项的更多说明,请参阅。

主页:http://www.microbesonline.org/fasttree/

参考文献

Price,M.N.,Dehal,P.S.和Arkin,A.P.(2010)FastTree 2--大比对的近似最大似然树。PLOS One,5(3):e9490。https://doi.org/10.1371/journal.pone.0009490.

示例

这是Windows上的示例:

import _Fasttree
fasttree_exe = r"C:\FasttreeWin32\fasttree.exe"
cmd = _Fasttree.FastTreeCommandline(fasttree_exe,
...                                     input=r'C:\Input\ExampleAlignment.fsa',
...                                     out=r'C:\Output\ExampleTree.tree')
print(cmd)
out, err = cmd()
print(out)
print(err)
__init__(cmd='fasttree', **kwargs)

初始化类。

property bionj

连接选项:与BioNJ相同的加权连接。

FastTree还将在NNIS期间对连接进行加权。

此属性控制-BioNJ开关的添加,将此属性视为布尔值。

property boot

指定支持值的重采样数量。

支持值选项:默认情况下,FastTree通过对站点可能性重采样1000次和Shimodaira Hasegawa测试来计算本地支持值。如果指定-nome,则在任何一种情况下,它都将计算最小进化引导支持,支持值为0到1之间的比例

使用-nosupport关闭支持值,或使用-boot 100仅使用100个重采样。

这控制-boot参数及其关联值的添加。将此属性设置为所需的参数值。

property cat

最大似然模型选项。

指定站点的费率类别数(默认值为20)。

这控制-cat参数及其关联值的添加。将此属性设置为所需的参数值。

property close

修改热门列表的关闭启发式

TOP-HITH启发式:默认情况下,FastTree使用TOP-HING列表来加快搜索速度--Close 0.75--修改Close启发式,越低越保守。

这控制-close参数及其关联值的添加。将此属性设置为所需的参数值。

property constraintWeight

拓扑搜索中约束的权重强度。

受约束的拓扑搜索选项:-constraintWeight--约束权重的大小。值1表示违反约束默认值100.0的树长度惩罚为1

这控制-constraintWeight参数及其关联值的添加。将此属性设置为所需的参数值。

property constraints

指定用于受约束拓扑搜索的路线文件

受约束的拓扑搜索选项:-约束对齐文件--值为0、1和的比对-不需要出现所有序列。0和1列定义受约束拆分。可能会违反某些约束(请参见标准错误中的“违反约束:”)。

这控制-Constraints参数及其关联值的添加。将此属性设置为所需的参数值。

property expert

显示专家级帮助。

此属性控制-Expert开关的添加,将此属性视为布尔值。

property fastest

仅搜索可见集合(每个节点的顶部命中)。

搜索最佳连接:默认情况下,FastTree将快速邻居连接的“可见集合”与本地爬山相结合,就像放松的邻居连接-最快-搜索可见集合(每个节点的最高命中)仅与原始的快速邻居连接不同,-最快更新在加入A和B之后可见(C)如果连接(AB,C)比连接(C,可见(C))更好-最快也以非常懒惰的方式更新外部距离,-最快集-第二,使用-最快-第二

此属性控制最快开关的添加,将此属性视为布尔值。

property gamma

报告离散伽马模型下的可能性。

最大似然模型选项:-Gamma--在使用CAT模型进行最后一轮优化分支长度之后,报告具有相同类别数量的离散Gamma模型下的可能性。FastTree使用相同的分支长度,但优化了Gamma形状参数和长度的比例。最终的树将具有重新缩放的长度。与-log一起使用时,这还会生成与Consel一起使用的每个站点的可能性,请参阅GammaLogToPaup.pl和FastTree网站上的文档。

此属性控制-Gamma开关的添加,将此属性视为布尔值。

property gtr

最大似然模型选项。

使用广义时间可逆,而不是(默认)Jukes-Cantor(仅限NT)

此属性控制-GTR开关的添加,将此属性视为布尔值。

property gtrfreq

-gtrfreq A C G T

这控制-gtrfreq参数及其关联值的添加。将此属性设置为所需的参数值。

property gtrrates

-gtrrate ac ag at CG ct gt

这控制-gtrrate参数及其关联值的添加。将此属性设置为所需的参数值。

property help

显示帮助。

此属性控制-help开关的添加,将此属性视为布尔值。

property input

输入<输入文件>

需要FASTA或PHYLIP格式的序列比对输入文件。默认情况下,FastTree需要蛋白质比对,核苷酸使用-nt。

这控制输入参数及其关联值的添加。将此属性设置为所需的参数值。

property intree

-intree newickfile--从newickfile读取起始树。

起始树中的任何分支长度都将被忽略。-带有-n的INTREE将为每个对齐读取单独的起始树。

这控制-intree参数及其关联值的添加。将此属性设置为所需的参数值。

property intree1

intree1 newickfile--为每条路线读取相同的起始树。

这控制-intree1参数及其关联值的添加。将此属性设置为所需的参数值。

property log

创建数据的日志文件,如中间树和每个站点的费率

-日志日志文件--保存中间树,以便在崩溃日志还报告每个站点的速率(1表示最慢的类别)时,可以提取树并重新启动长期运行的作业。

这控制-log参数及其关联值的添加。将此属性设置为所需的参数值。

property makematrix

-makematrix [对齐方式]

这控制-makematrix参数及其关联值的添加。将此属性设置为所需的参数值。

property matrix

指定核苷酸或氨基酸距离的矩阵

距离:默认:对于源自BLOSUM45的蛋白质序列、对数校正距离和氨基酸相异度矩阵,或者对于核苷酸序列,要指定不同的矩阵,请使用-Matrix FilePrefix或-Nomatrix

这控制-Matrix参数及其关联值的添加。将此属性设置为所需的参数值。

property mlacc

用于在每个NNI处优化分支的选项。

拓扑优化:默认情况下,FastTree尝试将树改进为最多4 log2(N) rounds of minimum-evolution nearest-neighbor interchanges (NNI), where N is the number of unique sequences, 2 rounds of subtree-prune-regraft (SPR) moves (also min. evo.), and up to 2 log(N)轮最大似然NNI。使用-nni设置最小轮数。埃沃。NNIS和-spr设置SPR循环。使用-mlacc 2或-mlacc 3始终优化每个NNI处的所有5个分支,并在2轮或3轮中优化所有5个分支。

这控制-mlacc参数及其关联值的添加。将此属性设置为所需的参数值。

property mllen

优化固定拓扑上的分支长度。

拓扑优化:默认情况下,FastTree尝试将树改进为最多4 log2(N) rounds of minimum-evolution nearest-neighbor interchanges (NNI), where N is the number of unique sequences, 2 rounds of subtree-prune-regraft (SPR) moves (also min. evo.), and up to 2 log(N)轮最大似然NNI。使用-nni设置最小轮数。埃沃。NNIS和-spr设置SPR循环。使用-mllen优化没有ML NNI的分支长度使用-mllen-nome with-intree优化固定拓扑上的分支长度。

此属性控制-mllen开关的添加,请将此属性视为布尔值。

property mlnni

设置最大似然NNI的轮数。

拓扑优化:默认情况下,FastTree尝试将树改进为最多4 log2(N) rounds of minimum-evolution nearest-neighbor interchanges (NNI), where N is the number of unique sequences, 2 rounds of subtree-prune-regraft (SPR) moves (also min. evo.), and up to 2 log(N)轮最大似然NNI。使用-nni设置最小轮数。埃沃。NNIS和-spr设置SPR循环。使用-mlnni设置最大似然NNI的轮数。

这控制-mlnni参数及其关联值的添加。将此属性设置为所需的参数值。

property n

-n--读取N条多条路线。

这只适用于Phylip交错格式。例如,您可以将其与Phylip的seqboot的输出一起使用。如果使用-n,FastTree将每行向标准输出写入一棵树。

这控制-n参数及其关联值的添加。将此属性设置为所需的参数值。

property nj

联接选项:常规(未加权)邻居联接(默认)

此属性控制-nj开关的添加,将此属性视为布尔值。

property nni

设置最小进化最近邻互通的轮次

拓扑优化:默认情况下,FastTree尝试将树改进为最多4 log2(N) rounds of minimum-evolution nearest-neighbor interchanges (NNI), where N is the number of unique sequences, 2 rounds of subtree-prune-regraft (SPR) moves (also min. evo.), and up to 2 log(N)轮最大似然NNI。使用-nni设置最小轮数。埃沃。NNIS。

这控制-nni参数及其关联值的添加。将此属性设置为所需的参数值。

property no2nd

关闭二级顶级点击率启发式。

TOP-HITH启发式:默认情况下,FastTree使用TOP-HING列表来加快搜索速度-notop(或-low)关闭此功能,并将所有叶子相互比较,所有新加入的节点相互比较

-第二个或-第二个打开或关闭第二级顶级点击率启发式,这会减少内存使用和运行时间,但可能会导致树质量的边际降低。(默认情况下,-最快将启用-2。)

此属性控制-noSecond开关的添加,将此属性视为布尔值。

property nocat

最大似然模型选项:无CAT模型(仅1个类别)

此属性控制-nocat开关的添加,将此属性视为布尔值。

property nomatrix

指定不应使用任何基质来表示核苷酸或氨基酸距离

距离:默认:对于源自BLOSUM45的蛋白质序列、对数校正距离和氨基酸相异度矩阵,或者对于核苷酸序列,要指定不同的矩阵,请使用-Matrix FilePrefix或-Nomatrix

此属性控制-onomatrix开关的添加,请将此属性视为布尔值。

property nome

将支持值计算更改为最小进化自举方法。

拓扑优化:默认情况下,FastTree尝试将树改进为最多4 log2(N) rounds of minimum-evolution nearest-neighbor interchanges (NNI), where N is the number of unique sequences, 2 rounds of subtree-prune-regraft (SPR) moves (also min. evo.), and up to 2 log(N)轮最大似然NNI。使用-nni设置最小轮数。埃沃。NNIS和-spr设置SPR循环。使用-mllen优化没有ML NNI的分支长度使用-mllen-nome with-intree优化固定拓扑上的分支长度

支持值选项:默认情况下,FastTree通过对站点可能性重采样1000次和Shimodaira Hasegawa测试来计算本地支持值。如果指定-nome,则在任何一种情况下,它都将计算最小进化引导支持,支持值是从0到1的比例。

此属性控制-nome开关的添加,将此属性视为布尔值。

property noml

停用min-evo NNIS和SPR。

拓扑优化:默认情况下,FastTree尝试将树改进为最多4 log2(N) rounds of minimum-evolution nearest-neighbor interchanges (NNI), where N is the number of unique sequences, 2 rounds of subtree-prune-regraft (SPR) moves (also min. evo.), and up to 2 log(N)轮最大似然NNI。使用-nni设置最小轮数。埃沃。NNIS和-spr设置SPR循环。使用-Noml关闭最小评估NNI和SPR(如果细化具有更多NNI的近似最大似然树,则非常有用)。

此属性控制-Noml开关的添加,并将此属性视为布尔值。

property nopr

-NOPR--不要将进度指示器写入stderr。

此属性控制-NOPR开关的添加,将此属性视为布尔值。

property nosupport

禁用支持值。

支持值选项:默认情况下,FastTree通过对站点可能性重采样1000次和Shimodaira Hasegawa测试来计算本地支持值。如果指定-nome,则在任何一种情况下,它都将计算最小进化引导支持,支持值为0到1之间的比例

使用-nosupport关闭支持值,或使用-boot 100仅使用100个重采样。

此属性控制-nosupport开关的添加,将此属性视为布尔值。

property notop

关闭热门列表以加快搜索速度

TOP-HITH启发式:默认情况下,FastTree使用TOP-HING列表来加快搜索速度-notop(或-low)关闭该功能,并将所有叶子和所有新加入的节点相互比较。

此属性控制-notop开关的添加,将此属性视为布尔值。

property nt

默认情况下,FastTree需要蛋白质比对,核苷酸使用-nt

此属性控制-nt开关的添加,并将此属性视为布尔值。

property out

输入<输出文件>

需要指定Newick树输出文件的路径。

这控制-out参数及其关联值的添加。将此属性设置为所需的参数值。

property pseudo

-伪 [重量] -伪计数与序列距离估计一起使用。

使用伪计数来估计很少重叠或没有重叠的序列之间的距离。(默认情况下禁用。)如果分析比对的序列很少重叠或没有重叠,建议使用。如果未指定权重,则为1.0

这将控制-seudo参数及其关联值的添加。将此属性设置为所需的参数值。

property quiet

-安静--正常操作期间不写入标准错误

(无进度指示器、无选项汇总、无可能性值等)

此属性控制-Quiet开关的添加,将此属性视为布尔值。

property quote

-QUOTE--向输出中的序列名称添加引号。

在输出中引用序列名称,并允许在其中使用空格、逗号、括号和冒号,但不允许使用‘字符(仅限FASTA文件)。

此属性控制-QUOTE开关的添加,将此属性视为布尔值。

property rawdist

关闭或调整AA或NT距离中的对数校正。

使用-rawdist关闭对数校正,或在AA或NT距离中使用%Different而不是Jukes-Cantor

距离:默认:对于源自BLOSUM45的蛋白质序列、对数校正距离和氨基酸相异度矩阵,或者对于核苷酸序列,要指定不同的矩阵,请使用-Matrix FilePrefix或-Nomatrix

此属性控制-rawdist开关的添加,请将此属性视为布尔值。

property refresh

用于将联接的节点与其他节点进行比较的条件的参数

最高命中启发式:默认情况下,FastTree使用最高命中列表来加速搜索-刷新0.8--如果最高命中列表小于所需长度的80%,或者最高命中列表的年龄为log2(M)或更长,则将连接的节点与所有其他节点进行比较。

这控制-fresh参数及其关联值的添加。将此属性设置为所需的参数值。

property second

打开2级顶级点击率启发式。

TOP-HITH启发式:默认情况下,FastTree使用TOP-HING列表来加快搜索速度-notop(或-low)关闭此功能,并将所有叶子相互比较,所有新加入的节点相互比较

-第二个或-第二个打开或关闭第二级顶级点击率启发式,这会减少内存使用和运行时间,但可能会导致树质量的边际降低。(默认情况下,-最快将启用-2。)

此属性控制-2开关的添加,将此属性视为布尔值。

property seed

使用-Seed初始化随机数生成器。

支持值选项:默认情况下,FastTree通过对站点可能性重采样1000次和Shimodaira Hasegawa测试来计算本地支持值。如果指定-nome,则在任何一种情况下,它都将计算最小进化引导支持,支持值是从0到1的比例。

这控制-Seed参数及其关联值的添加。将此属性设置为所需的参数值。

property slow

使用详尽的搜索。

搜索最佳连接:默认情况下,FastTree将快速邻居连接的“可见集合”与本地爬山相结合,就像放松的邻居连接-慢速-穷举搜索(像NJ或BioNJ,但差距处理不同)-慢速需要1,250个蛋白质的半小时而不是8秒

此属性控制-low开关的添加,请将此属性视为布尔值。

property slownni

关闭启发式以避免具有NNI的常量子树。

拓扑优化:默认情况下,FastTree尝试将树改进为最多4 log2(N) rounds of minimum-evolution nearest-neighbor interchanges (NNI), where N is the number of unique sequences, 2 rounds of subtree-prune-regraft (SPR) moves (also min. evo.), and up to 2 log(N)轮最大似然NNI。使用-nni设置最小轮数。埃沃。NNIS和-spr设置SPR循环。使用-lownni关闭试探法以避免恒定子树(同时影响ML和ME NNI)。

此属性控制-slownni开关的添加,将此属性视为布尔值。

property spr

设置子树修剪-再嫁接的轮次

拓扑优化:默认情况下,FastTree尝试将树改进为最多4 log2(N) rounds of minimum-evolution nearest-neighbor interchanges (NNI), where N is the number of unique sequences, 2 rounds of subtree-prune-regraft (SPR) moves (also min. evo.), and up to 2 log(N)轮最大似然NNI。使用-nni设置最小轮数。埃沃。NNIS和-spr设置SPR循环。

这控制-spr参数及其关联值的添加。将此属性设置为所需的参数值。

property sprlength

在拓扑优化中设置最大SPR移动长度(默认值为10)。

拓扑优化:默认情况下,FastTree尝试将树改进为最多4 log2(N) rounds of minimum-evolution nearest-neighbor interchanges (NNI), where N is the number of unique sequences, 2 rounds of subtree-prune-regraft (SPR) moves (also min. evo.), and up to 2 log(N)轮最大似然NNI。使用-nni设置最小轮数。埃沃。NNIS和-spr设置SPR循环。

这将控制-sprlength参数及其关联值的添加。将此属性设置为所需的参数值。

property top

热门列表可加快搜索速度

TOP-HITH启发式:默认情况下,FastTree使用TOP-HING列表来加快搜索速度-notop(或-low)关闭该功能,并将所有叶子和所有新加入的节点相互比较。

此属性控制-top开关的添加,将此属性视为布尔值。

property topm

更改点击率最高的计算方法

热门启发式:默认情况下,FastTree使用热门列表来加速搜索-topm 1.0--将热门列表大小设置为参数 SQRT(N)FastTree估计前2个叶的前m个命中率 ‘Close’邻居的M次命中,其中Close定义为d(种子,关闭)<0.75 D(种子,2级命中 m),并随着连接的进行而更新最热门的点击数。

这控制-topm参数及其关联值的添加。将此属性设置为所需的参数值。

property wag

最大似然模型选项。

Whelan-and-Goldman 2001模型代替(默认)Jones-Taylor-Thorton 1992模型(A.A.仅限)

此属性控制-wag开关的添加,将此属性视为布尔值。