Bio.AlignIO.PhylipIO模块

来自Joe Felsenstein的Phylip工具的AlignIO对“Phylip”格式的支持。

您需要通过Bio.AlignIO函数使用此模块(如果您想要直接处理有间隙的序列,则通过Bio.SeqIO函数)。

还提供了对“REAGEN PHYLIP”格式的支持。松弛Phylip与标准Phylip格式在以下方面不同:

  • 序列ID中不允许有空格。

  • 不执行截断。相反,序列ID被填充到最长的ID长度,而不是10个字符。空格将序列标识符与序列分隔。

RAxML和PHYML支持松弛Phylip。

注意事项

“树之谜”(Schmidt et al.2003)和PHYML(Guindon And Gascuel 2003)一个点/句点(“.”)序列中的字符被解释为表示与第一序列中相同的字符。从3.3点到3.69点http://evolution.genetics.washington.edu/phylip/doc/sequence.html的PHYLIP文档说:

句点以前也是允许的,但现在不允许了,因为它有时在其他程序中有不同的用法

Biopython1.58或更高版本将序列中的点/句点视为无效,无论对于读取还是写入都是如此。较早的版本没有使用点/句点的特殊功能。

class Bio.AlignIO.PhylipIO.PhylipWriter(handle)

基类:SequentialAlignmentWriter

PHYLIP对齐写入器。

write_alignment(alignment, id_width=_PHYLIP_ID_WIDTH)

使用此选项将(另一个)单对齐写入打开的文件。

此代码将写入隔行扫描对齐(当序列长度超过50个字符时)。

请注意,记录标识符被严格截断为id_width,缺省为符合PHYLIP标准所需的值。

有关文件格式的更多信息,请参见:http://evolution.genetics.washington.edu/phylip/doc/sequence.html http://evolution.genetics.washington.edu/phylip/doc/main.html#inputfiles

class Bio.AlignIO.PhylipIO.PhylipIterator(handle, seq_count=None)

基类:AlignmentIterator

读取Phylip对齐文件,返回MultipleSeqAlignment迭代器。

记录标识符限为最多10个字符。

它只处理交错的Phylip文件!在序列拆分到多行的情况下,顺序文件不起作用。

有关文件格式的更多信息,请参见:http://evolution.genetics.washington.edu/phylip/doc/sequence.html http://evolution.genetics.washington.edu/phylip/doc/main.html#inputfiles

id_width = 10
__next__()

从句柄解析下一个对齐方式。

class Bio.AlignIO.PhylipIO.RelaxedPhylipWriter(handle)

基类:PhylipWriter

轻松的Phylip格式编写器。

write_alignment(alignment)

写一个放松的PHILPE对齐方式。

class Bio.AlignIO.PhylipIO.RelaxedPhylipIterator(handle, seq_count=None)

基类:PhylipIterator

轻松的Phylip格式迭代器。

class Bio.AlignIO.PhylipIO.SequentialPhylipWriter(handle)

基类:SequentialAlignmentWriter

顺序Phylip格式编写器。

write_alignment(alignment, id_width=_PHYLIP_ID_WIDTH)

将Phylip对齐写到手柄上。

class Bio.AlignIO.PhylipIO.SequentialPhylipIterator(handle, seq_count=None)

基类:PhylipIterator

顺序Phylip格式迭代器。

顺序格式具有与正常交织格式相同的限制,不同之处在于序列是按顺序列出的,每个序列在下一个序列开始之前完整写入。根据用于输入文件格式化的PHYLIP文档,可以在序列中的任何点选择性地输入换行符和空格。

__next__()

从句柄解析下一个对齐方式。

Bio.AlignIO.PhylipIO.sanitize_name(name, width=None)

清理输出的序列标识符。

删除禁用字符“[]()”,并将字符“:;”替换为“|”。如果指定,名称将被截断为“width”字符。