Bio. DBC.PICIO模块
PICIO:读写蛋白质内部协调(.pic)数据文件。
- Bio.PDB.PICIO.read_PIC(file: TextIO, verbose: bool = False, quick: bool = False, defaults: bool = False) Structure
从文件加载蛋白质内部坐标(.pic)数据。
- PIC文件格式:
评论行以#开头
- (可选)ZB HEADER记录
idcode和沉积日期建议,但可选
沉积日期以TSB格式或Biopython更改
(可选)DBC标题记录
- 重复:
Biopython残留完整ID -设置返回结构的残留ID
(可选)连锁启动的DBC N、CA、C ATOM记录
(可选)PIC Hedra残留物记录
(可选)PIC Dihedera残留物记录
(可选)列出AtomKeys和b因子的BFAC记录
改进将定义HOH(水)条目的相对位置。
如果默认值=True,将为任何值提供收件箱。 默认值在ic_data.py中提供,但结构会随着与真实坐标的任何偏差而迅速退化。 尝试
Bio.PDB.internal_coords.IC_Residue.pic_flags
选项来write_PIC()
来验证这一点。N.B.如果O存在,则在装配中忽略二面体(i-1)C-N-CA-CB。
默认情况下,C-Beta使用O-C-CA-CB放置,但某些DBC文件残基中缺少O,这意味着无法放置侧链。 提供替代CB路径(i-1)C-N-CA-CB是为了规避这一点,但如果需要,则必须结合PHI(i-1)C-N-CA-C)进行调整,因为它们重叠(参见
bond_set()
和bond_rotate()
自动处理)。- 参数:
file (Bio.File) --
as_handle()
文件名或处理verbose (bool) -- 线路不符合预期时投诉
quick (bool) -- 不检查所有二面体的残基(没有默认值)
defaults (bool) -- 根据需要从参考数据库创建二/面体。如果IC_Residue.accept_atoms中存在“H”,则生成酰胺质子
- 返回:
Biopython结构对象,具有.internal_coord属性但没有坐标的残基,除非提供链起始N、CA、C原子, OR 解析时无失败(除非verbose=True,否则保持沉默)
- Bio.PDB.PICIO.read_PIC_seq(seqRec: SeqRecord, pdbid: str = None, title: str = None, chain: str = None) Structure
读
SeqRecord
使用默认的内部坐标转换为结构。
- Bio.PDB.PICIO.enumerate_atoms(entity)
确保实体中的所有原子都设置了序列号。
- Bio.PDB.PICIO.pdb_date(datestr: str) str
将yyyy-mm-dd日期转换为dd-month-yy。
- Bio.PDB.PICIO.write_PIC(entity, file, pdbid=None, chainid=None, picFlags: int = IC_Residue.picFlagsDefault, hCut: float | None = None, pCut: float | None = None)
将蛋白质内部坐标(PIC)写入文件。
看到
read_PIC()
用于文件格式。看到IC_Residue.pic_accuracy
以改变数字准确性。回归到较低的实体级别(M、C、R)。- 参数:
entity (Entity) -- Biopython DBC实体对象:S、M、C或R
file (Bio.File) --
as_handle()
文件名或处理pdbid (str) -- DBC id代码,如果未提供,则从实体读取
chainid (char) -- DBC链ID,根据需要从C级别entity.id设置
picFlags (int) --
控制输出的布尔标志,在中定义
Bio.PDB.internal_coords.IC_Residue.pic_flags
“磅/平方英寸”,
“天哪”,
“phy”,
“tau”,# tau面体(N-Ca-C)
“chi1”,
“chi 2”,
“chi 3”,
“chi 4”,
“chi 5”,
“pomg”,#Pro Omega
“气”, #chi 1至chi 5
“classic_b”,#si| Phi| tau|波格
“经典”, #经典_b|迟
“hedra”, #所有面体,包括键长
“初级”, #所有主二面体
“副”,#所有副二面体(与主二面体的固定角度)
“所有”, #地狱|初级|二次
“initAtoms”,# XYZ初始Tau(N-Ca-C)的坐标
“b因素”
默认为一切::
picFlagsDefault = ( pic_flags.all | pic_flags.initAtoms | pic_flags.bFactors )
代码中的用途::
# just primary dihedra and all hedra picFlags = ( IC_Residue.pic_flags.primary | IC_Residue.pic_flags.hedra ) # no B-factors: picFlags = IC_Residue.picFlagsDefault picFlags &= ~IC_Residue.pic_flags.bFactors
read_PIC()
与 (defaults=True) 将对遗漏的任何内容使用默认值hCut (float) -- 默认无仅写入ref dbangle std dev大于此值的hedra
pCut (float) -- 默认无仅写入ref dbangle std dev大于此值的主二面体
Default values :
2019年9月Dunbrack cullpdb_pc20_res2.2_R1.0的平均数据。
请参阅
PISCES: A Protein Sequence Culling Server <https://dunbrack.fccc.edu/pisces/> _
'G. Wang and R. L. Dunbrack, Jr. PISCES: a protein sequence culling server. Bioinformatics, 19:1589-1591, 2003.'
“主要”和“次要”二面体在ic_data.py中定义。 具体来说,二级二面体可以确定为从另一个已知角度的固定旋转,例如N-Ca-C-O可以从N-Ca-C-N(si)估计。
默认值的标准偏差列在<biopython distribution>/Bio/PDB/ic_data.py中,可用于限制默认的面体和两面体与结构的输出精确测量值(参见上文的hCut和pCut)。 主两面体的默认值(psi、phi、omega、chi 1等)被选为最常见的整数值,而不是平均值。
- 抛出:
PDBException -- 如果实体级别为A(Atom)
Exception -- 如果实体没有.level属性