Bio.codonalign.codonseq模块¶

用于处理编码序列的代码。

CodonSeq类继承自Seq类。这是在biopython中处理CodonAlignment中的序列的核心类。

class Bio.codonalign.codonseq.CodonSeq(data='', gap_char='-', rf_table=None)¶

基类：Seq

CodonSeq设计为在CodonAlignment类的SeqRecords内。

CodonSeq很有用，因为它允许用户在翻译CodonSeq时指定阅读框架

CodonSeq还通过调用get_codon()方法接受密码子样式切片。

重要信息： 如果您指定RF_TABLE，则UnGap CodonSeq可以是任意长度。Gap CodonSeq应该是3的倍数。

>>> codonseq = CodonSeq("AAATTTGGGCCAAATTT", rf_table=(0,3,6,8,11,14))
>>> print(codonseq.translate())
KFGAKF

测试GET_FULL_RF_TABLE方法

>>> p = CodonSeq('AAATTTCCCGG-TGGGTTTAA', rf_table=(0, 3, 6, 9, 11, 14, 17))
>>> full_rf_table = p.get_full_rf_table()
>>> print(full_rf_table)
[0, 3, 6, 9, 12, 15, 18]
>>> print(p.translate(rf_table=full_rf_table, ungap_seq=False))
KFPPWV*
>>> p = CodonSeq('AAATTTCCCGGGAA-TTTTAA', rf_table=(0, 3, 6, 9, 14, 17))
>>> print(p.get_full_rf_table())
[0, 3, 6, 9, 12.0, 15, 18]
>>> p = CodonSeq('AAA------------TAA', rf_table=(0, 3))
>>> print(p.get_full_rf_table())
[0, 3.0, 6.0, 9.0, 12.0, 15]

__init__(data='', gap_char='-', rf_table=None)¶: 初始化类。

get_codon(index)¶: 从序列中获取索引密码子。

get_codon_num()¶: 返回CodonSeq中的密码子个数。

translate(codon_table=None, stop_symbol='*', rf_table=None, ungap_seq=True)¶

根据rf_table中的读框转换CodonSeq。

此时，用户可以指定RF_TABLE。如果要在翻译的序列中包含间隙，这是唯一的方法。为此，unap_seq应设置为true。

toSeq()¶: 将DNA转换为序列对象。

get_full_rf_table()¶

返回CodonSeq记录的完整RF_TABLE。

完整的RF_TABLE不同于普通的RF_TABLE，因为它转换CodonSeq中的间隙。这有助于构建包含帧移位的对齐。

full_translate(codon_table=None, stop_symbol='*')¶: 应用完全平移，并考虑间隙。

ungap(gap='-')¶: 返回不带间隙字符的序列副本。

classmethod from_seq(seq, rf_table=None)¶: 从序列数据中获取密码子序列。

__abstractmethods__ = frozenset({})¶

Bio.codonalign.codonseq.cal_dn_ds(codon_seq1, codon_seq2, method='NG86', codon_table=None, k=1, cfreq=None)¶

计算给定两个序列的DN和DS。

可用的方法：

NG86- Nei and Gojobori (1986) (PMID 3444411)。
LWL85- Li et al. (1985) (PMID 3916709)。
ml- Goldman and Yang (1994) (PMID 7968486)。
YN00- Yang and Nielsen (2000) (PMID 10666704)。

参数：

codon_seq1-CodonSeq或包含CodonSeq的SeqRecord
codon_seq2-包含CodonSeq的CodonSeq或或SeqRecord
W-转换/转换比
cfreq-当前密码子频率矢量只能在使用ML方法时指定。获得cfreq的可能方式是：F1x4、F3x4和F61。