Bio.SeqUtils.CheckSum模块

用于计算分类序列校验和的函数。

Bio.SeqUtils.CheckSum.crc32(seq)

返回序列(String或Seq对象)的crc32校验和。

请注意,此案例很重要:

>>> crc32("ACGTACGTACGT")
20049947
>>> crc32("acgtACGTacgt")
1688586483
Bio.SeqUtils.CheckSum.crc64(s)

返回序列(String或Seq对象)的crc64校验和。

请注意,此案例很重要:

>>> crc64("ACGTACGTACGT")
'CRC-C4FBB762C4A87EBD'
>>> crc64("acgtACGTacgt")
'CRC-DA4509DC64A87EBD'
Bio.SeqUtils.CheckSum.gcg(seq)

返回序列(String或Seq对象)的GCG校验和(Int)。

给定核苷酸或氨基酸序列(或任何字符串),返回GCG校验和(INT)。GCG程序使用的校验和。序列类型=字符串

基于BioPerl GCG_CHECKSUM。由塞巴斯蒂安·巴西改编,约翰·兰顿,巴勃罗·齐利亚尼和加布里埃尔·热内利纳帮助。

所有序列都转换为大写。

>>> gcg("ACGTACGTACGT")
5688
>>> gcg("acgtACGTacgt")
5688
Bio.SeqUtils.CheckSum.seguid(seq)

返回序列(String或Seq对象)的SEGUID(String)。

给定核苷酸或氨基酸序列(或任何字符串),返回SEGUID字符串(序列全球唯一标识符)。序列类型=字符串

请注意,大小写并不重要:

>>> seguid("ACGTACGTACGT")
'If6HIvcnRSQDVNiAoefAzySc6i4'
>>> seguid("acgtACGTacgt")
'If6HIvcnRSQDVNiAoefAzySc6i4'

有关SEGUID的更多信息,请参阅:http://bioinformatics.anl.gov/seguid/https://doi.org/10.1002/pmic.200600032