Bio. DBC.PICIO模块

PICIO:读写蛋白质内部协调(.pic)数据文件。

Bio.PDB.PICIO.read_PIC(file: TextIO, verbose: bool = False, quick: bool = False, defaults: bool = False) Structure

从文件加载蛋白质内部坐标(.pic)数据。

PIC文件格式:
  • 评论行以#开头

  • (可选)ZB HEADER记录
    • idcode和沉积日期建议,但可选

    • 沉积日期以TSB格式或Biopython更改

  • (可选)DBC标题记录

  • 重复:
    • Biopython残留完整ID -设置返回结构的残留ID

    • (可选)连锁启动的DBC N、CA、C ATOM记录

    • (可选)PIC Hedra残留物记录

    • (可选)PIC Dihedera残留物记录

    • (可选)列出AtomKeys和b因子的BFAC记录

改进将定义HOH(水)条目的相对位置。

如果默认值=True,将为任何值提供收件箱。 默认值在ic_data.py中提供,但结构会随着与真实坐标的任何偏差而迅速退化。 尝试 Bio.PDB.internal_coords.IC_Residue.pic_flags 选项来 write_PIC() 来验证这一点。

N.B.如果O存在,则在装配中忽略二面体(i-1)C-N-CA-CB。

默认情况下,C-Beta使用O-C-CA-CB放置,但某些DBC文件残基中缺少O,这意味着无法放置侧链。 提供替代CB路径(i-1)C-N-CA-CB是为了规避这一点,但如果需要,则必须结合PHI(i-1)C-N-CA-C)进行调整,因为它们重叠(参见 bond_set()bond_rotate() 自动处理)。

参数:
  • file (Bio.File) -- as_handle() 文件名或处理

  • verbose (bool) -- 线路不符合预期时投诉

  • quick (bool) -- 不检查所有二面体的残基(没有默认值)

  • defaults (bool) -- 根据需要从参考数据库创建二/面体。如果IC_Residue.accept_atoms中存在“H”,则生成酰胺质子

返回:

Biopython结构对象,具有.internal_coord属性但没有坐标的残基,除非提供链起始N、CA、C原子, OR 解析时无失败(除非verbose=True,否则保持沉默)

Bio.PDB.PICIO.read_PIC_seq(seqRec: SeqRecord, pdbid: str = None, title: str = None, chain: str = None) Structure

SeqRecord 使用默认的内部坐标转换为结构。

Bio.PDB.PICIO.enumerate_atoms(entity)

确保实体中的所有原子都设置了序列号。

Bio.PDB.PICIO.pdb_date(datestr: str) str

将yyyy-mm-dd日期转换为dd-month-yy。

Bio.PDB.PICIO.write_PIC(entity, file, pdbid=None, chainid=None, picFlags: int = IC_Residue.picFlagsDefault, hCut: float | None = None, pCut: float | None = None)

将蛋白质内部坐标(PIC)写入文件。

看到 read_PIC() 用于文件格式。看到 IC_Residue.pic_accuracy 以改变数字准确性。回归到较低的实体级别(M、C、R)。

参数:
  • entity (Entity) -- Biopython DBC实体对象:S、M、C或R

  • file (Bio.File) -- as_handle() 文件名或处理

  • pdbid (str) -- DBC id代码,如果未提供,则从实体读取

  • chainid (char) -- DBC链ID,根据需要从C级别entity.id设置

  • picFlags (int) --

    控制输出的布尔标志,在中定义 Bio.PDB.internal_coords.IC_Residue.pic_flags

    • “磅/平方英寸”,

    • “天哪”,

    • “phy”,

    • “tau”,# tau面体(N-Ca-C)

    • “chi1”,

    • “chi 2”,

    • “chi 3”,

    • “chi 4”,

    • “chi 5”,

    • “pomg”,#Pro Omega

    • “气”, #chi 1至chi 5

    • “classic_b”,#si| Phi| tau|波格

    • “经典”, #经典_b|迟

    • “hedra”, #所有面体,包括键长

    • “初级”, #所有主二面体

    • “副”,#所有副二面体(与主二面体的固定角度)

    • “所有”, #地狱|初级|二次

    • “initAtoms”,# XYZ初始Tau(N-Ca-C)的坐标

    • “b因素”

    默认为一切::

    picFlagsDefault = (
        pic_flags.all | pic_flags.initAtoms | pic_flags.bFactors
    )
    

    代码中的用途::

    # just primary dihedra and all hedra
    picFlags = (
        IC_Residue.pic_flags.primary | IC_Residue.pic_flags.hedra
    )
    
    # no B-factors:
    picFlags = IC_Residue.picFlagsDefault
    picFlags &= ~IC_Residue.pic_flags.bFactors
    

    read_PIC()(defaults=True) 将对遗漏的任何内容使用默认值

  • hCut (float) -- 默认无仅写入ref dbangle std dev大于此值的hedra

  • pCut (float) -- 默认无仅写入ref dbangle std dev大于此值的主二面体

Default values :

2019年9月Dunbrack cullpdb_pc20_res2.2_R1.0的平均数据。

请参阅

PISCES: A Protein Sequence Culling Server <https://dunbrack.fccc.edu/pisces/> _

'G. Wang and R. L. Dunbrack, Jr. PISCES: a protein sequence culling server. Bioinformatics, 19:1589-1591, 2003.'

“主要”和“次要”二面体在ic_data.py中定义。 具体来说,二级二面体可以确定为从另一个已知角度的固定旋转,例如N-Ca-C-O可以从N-Ca-C-N(si)估计。

默认值的标准偏差列在<biopython distribution>/Bio/PDB/ic_data.py中,可用于限制默认的面体和两面体与结构的输出精确测量值(参见上文的hCut和pCut)。 主两面体的默认值(psi、phi、omega、chi 1等)被选为最常见的整数值,而不是平均值。

抛出:
  • PDBException -- 如果实体级别为A(Atom)

  • Exception -- 如果实体没有.level属性