Bio. Codonign.Codonseq模块
用于处理编码序列的代码。
CodonSeq类继承自Seq类。这是处理生物Python中CodonAlliance中序列的核心类。
- class Bio.codonalign.codonseq.CodonSeq(data='', gap_char='-', rf_table=None)
基类:
Seq
CodonSeq被设计为位于CodonAlignment类的SeqRecords内。
CodonSeq很有用,因为它允许用户在翻译CodonSeq时指定阅读框架
CodonSeq还通过调用get_codon()方法接受密码子风格切片。
Important: 如果您指定ref_table,则Ungapped CodonSeq可以是任何长度。Gapped CodonSeq应该是三的倍数。
>>> codonseq = CodonSeq("AAATTTGGGCCAAATTT", rf_table=(0,3,6,8,11,14)) >>> print(codonseq.translate()) KFGAKF
测试get_full_ref_table方法
>>> p = CodonSeq('AAATTTCCCGG-TGGGTTTAA', rf_table=(0, 3, 6, 9, 11, 14, 17)) >>> full_rf_table = p.get_full_rf_table() >>> print(full_rf_table) [0, 3, 6, 9, 12, 15, 18] >>> print(p.translate(rf_table=full_rf_table, ungap_seq=False)) KFPPWV* >>> p = CodonSeq('AAATTTCCCGGGAA-TTTTAA', rf_table=(0, 3, 6, 9, 14, 17)) >>> print(p.get_full_rf_table()) [0, 3, 6, 9, 12.0, 15, 18] >>> p = CodonSeq('AAA------------TAA', rf_table=(0, 3)) >>> print(p.get_full_rf_table()) [0, 3.0, 6.0, 9.0, 12.0, 15]
- __init__(data='', gap_char='-', rf_table=None)
初始化课程。
- get_codon(index)
从序列中获取索引密码子。
- get_codon_num()
返回CodonSeq中的密码子数。
- translate(codon_table=None, stop_symbol='*', rf_table=None, ungap_seq=True)
根据ref_table中的阅读框架翻译CodonSeq。
用户此时可以指定ref_table。如果您想在翻译的序列中包含空白,这是唯一的方法。为此目的,ungap_seq应设置为true。
- toSeq()
将DNA转换为seq对象。
- get_full_rf_table()
返回CodonSeq记录的完整ref_table。
完整的ref_table与普通的ref_table的不同之处在于,它翻译了CodonSeq中的间隙。构建包含移码的对齐是有帮助的。
- full_translate(codon_table=None, stop_symbol='*')
在考虑差距的情况下应用完整翻译。
- ungap(gap='-')
返回不含间隔字符的序列副本。
- classmethod from_seq(seq, rf_table=None)
从序列数据中获取密码子序列。
- __abstractmethods__ = frozenset({})
- __annotations__ = {'_data': 'Union[bytes, SequenceDataAbstractBaseClass]'}
- __firstlineno__ = 22
- __static_attributes__ = ('gap_char', 'rf_table')
- Bio.codonalign.codonseq.cal_dn_ds(codon_seq1, codon_seq2, method='NG86', codon_table=None, k=1, cfreq=None)
计算给定两个序列的dN和dS。
- 可用方法:
NG 86- Nei and Gojobori (1986) (PMID 3444411)。
LWL85 - Li et al. (1985) (PMID 3916709)。
ML - Goldman and Yang (1994) (PMID 7968486)。
公司简介 Yang and Nielsen (2000) (PMID 10666704)。
- 论点:
Codon_seq 1- CodonSeq或包含CodonSeq的SeqRecord
Codon_seq2 - CodonSeq或包含CodonSeq的SeqRecord
w -转变/颠倒比
cfreq -仅在使用ML方法时才能指定当前密码子频率载体。获取cfreq的可能方法有:F1 x4、F3 x4和F61。