Bio.SeqIO.PhdIO模块¶
Bio.SeqIO支持“PHD”文件格式。
PHD文件由Phred输出,并由PHRAP和CONSED使用。
您需要通过Bio.SeqIO函数使用此模块,格式名为“phd”。另请参见基础Bio.Sequencing.Phd模块。
例如,使用Bio.SeqIO,我们可以从Biopython单元测试中读入示例Phred文件之一:
>>> from Bio import SeqIO
>>> for record in SeqIO.parse("Phd/phd1", "phd"):
... print(record.id)
... print("%s..." % record.seq[:10])
... print("%s..." % record.letter_annotations["phred_quality"][:10])
34_222_(80-A03-19).b.ab1
ctccgtcgga...
[9, 9, 10, 19, 22, 37, 28, 28, 24, 22]...
425_103_(81-A03-19).g.ab1
cgggatccca...
[14, 17, 22, 10, 10, 10, 15, 8, 8, 9]...
425_7_(71-A03-19).b.ab1
acataaatca...
[10, 10, 10, 10, 8, 8, 6, 6, 6, 6]...
由于Phred文件包含质量分数,因此可以将其另存为FASTQ或QUAL文件,例如使用Bio.SeqIO.write(.),或仅使用SeqRecord对象的Format方法:
>>> print(record[:50].format("fastq"))
@425_7_(71-A03-19).b.ab1
acataaatcaaattactnaccaacacacaaaccngtctcgcgtagtggag
+
++++))'''')(''')$!$''')''''(+.''$!$))))+)))'''''''
或,
>>> print(record[:50].format("qual"))
>425_7_(71-A03-19).b.ab1
10 10 10 10 8 8 6 6 6 6 8 7 6 6 6 8 3 0 3 6 6 6 8 6 6 6 6 7
10 13 6 6 3 0 3 8 8 8 8 10 8 8 8 6 6 6 6 6 6 6
注意:这些示例仅显示前50个碱基,以保持较短的输出。
- Bio.SeqIO.PhdIO.PhdIterator(source)¶
从PHD文件返回SeqRecord对象。
- 参数:
source-以文本模式打开的输入流,或文件路径
这使用Bio.Sequencing.Phd模块来完成繁重的工作。