Biopython是Python最大,最受欢迎的生物信息学软件包。它包含许多用于常见生物信息学任务的不同子模块.它由Chapman和Chang开发,主要用Python编写.它还包含用于优化软件复杂计算部分的C代码。它运行在Windows,Linux,Mac OS X等上。
Biopython项目是旨在减少计算生物学中代码重复,由国际开发人员协会创建。它包含表示生物序列和序列注释的类,并且能够读取和写入各种文件格式(FASTA,FASTQ,GenBank和Clustal等), 支持以程序化方式访问生物信息的在线数据库(例如,NCBI)。独立的模块扩展了Biopython的序列比对,蛋白质结构,群体遗传学,系统发育,序列基序和机器学习等功能。
基本上,Biopython是python模块的集合,提供处理DNA,RNA和蛋白质序列操作的函数,例如反向补充它提供了许多解析器来读取所有主要的基因数据库,如GenBank,SwissPort,FASTA等,以及包装/接口来运行其他流行的生物信息学软件/工具,如NCBI BLASTN,Entrez等,在python环境中。它有像BioPerl,BioJava和BioRuby这样的兄弟项目。
Biopython的目标是通过python语言提供对生物信息学的简单,标准和广泛的访问: Biopython的具体目标列在下面和下面;提供对生物信息学资源的标准化访问.
让我们检查一些用例(群体遗传学,RNA结构等),并尝试了解Biopython如何在该领域发挥重要作用 : 去;
群体遗传学是对群体内遗传变异的研究,包括对种群中基因和等位基因频率在空间和时间上变化的检测和模拟.
Biopython提供生物.PopGen模块用于群体遗传学.该模块包含收集有关经典群体遗传信息的所有必要功能.
对我们的生活至关重要的三种主要生物大分子是DNA,RNA和蛋白质.蛋白质是细胞的主力,并且作为酶发挥重要作用. DNA(脱氧核糖核酸)被认为是细胞的"蓝图".它携带细胞生长,摄取营养和繁殖所需的所有遗传信息. RNA(核糖核酸)在细胞中充当"DNA复印体".
Biopython提供Bio.Sequence对象,代表核苷酸,构建DNA和RNA.
Copyright © Since 2014.
开源地理空间基金会中文分会
吉ICP备05002032号
Powered by TorCMS