5.1. 拓扑阅读器 MDAnalysis.topology
此子模块包含拓扑读取器。拓扑文件提供系统中原子的列表、它们的连接性以及可能的附加信息,例如B因子、部分电荷等。细节取决于文件格式,并且并非每个拓扑文件都提供所有(或甚至任何)附加数据。这些数据可以通过原子组属性进行访问。
至少,所有拓扑解析器都将提供原子ID、原子类型、质量、残基、重新编号和编号,以及将所有原子分配给残基,将所有残基分配给片段。对于没有残基和链段的体系,这导致存在所有原子所属的单一残基和链段。当数据不是由文件提供时,通常会根据文件中的其他数据进行猜测。如果发生这种情况,将始终发出UserWarning。
下表列出了当前支持的拓扑格式及其提供的属性。
名字 |
分机 |
属性 |
备注 |
---|---|---|---|
CHARMM/XploR PSF |
PSF |
重新命名、名称、类型、电荷、键、角度、二面体、突破者 |
CHARMM/XPLOR/NAMD 拓扑格式; |
CHARMM卡 [1] |
CRD |
名字,临时因素,更名, |
“卡片”坐标输出自 CHARMM; 处理标准格式或扩展格式; |
布鲁克海文 [1] |
PDB/ENT |
名称、债券、地址、重新编号、类型、链接、占有率、临时因素、地址、代码、重新命名、编号 |
默认情况下读取简化的PDB格式(如MD模拟中所用 |
XPDB [1] |
PDB |
作为pdb,但icodes除外 |
扩展的PDB格式如由例如, NAMD (可以使用5位残数)。要使用,请明确指定格式“xpbd”: |
PQR [1] |
PQR |
名称、费用、类型、半径、驻留、重命名、icodes、segids |
类似PDB但以空格分隔的具有电荷和半径信息的文件,例如, APBS. |
PDBQT [1] |
PDBQT |
名称、类型、altLocs、费用、重命名、居住地、icodes、占有率、临时因素、segid、 |
使用的文件格式 AutoDock 原子类型和部分电荷。模块: |
GROMOS96 [1] |
GRO |
名字,居住地,更名, |
GROMOS96坐标文件(例如,由 Gromacs) |
琥珀 |
Top、prmtop、parm7 |
名称、费用TYPE_INDEX、类型、重命名 |
简单 Amber 格式读取器(仅支持标志子集); |
DESRES [1] |
DMS |
名称、编号、质量、费用、链接、驻留、更名、编号、半径、 |
DESRES分子结构阅读器(仅支持原子和键记录) Desmond 和安东; |
TPR [2] |
TPR |
名称、类型、驻留、更名、费用、键合、质量、分子类型、分子数 |
Gromacs 便携式运行输入读取器(对一些较新版本的文件格式的有限实验支持); |
ITP |
ITP |
名称、类型、驻留、重新命名、费用、绑定、质量、Segids、模具类型、计费组 |
Gromacs 包括拓扑图文件; |
MOL2 [1] |
钼2 |
身份证,姓名,类型,住所,费用,债券,更名, |
TRIPOS MOL2分子结构格式; |
LAMMPS [1] |
数据 |
ID、类型、质量、电荷、残留物、键、角、二面体 |
|
LAMMPS [1] |
Lammps转储 |
ID、群众 |
LAMMPS ASCII转储文件读取器 |
XYZ [1] |
XYZ |
姓名 |
XYZ文件解析器。只从原子读取标签并构造最小的拓扑数据。 |
TXYZ [1] |
Txyz,圆弧 |
名称、原子、质量、类型、键 |
Tinker XYZ文件解析器。读取原子标签、数字和连接性;根据原子名称猜测质量。 |
GAMESS [1] |
GM,日志 |
名字,原子电荷, |
GAMESS 输出解析器。只读集合部分的原子(原子、元素和坐标)并构建拓扑。 |
DL_POLY [1] |
配置、历史记录 |
身份证,姓名 |
DL_POLY CONFIG or HISTORY file. Reads only the
atom names. If atoms are written out of order, will
correct the order.
|
Hoomd XML |
XML |
类型、电荷、半径、质量键、角、二面体 |
HOOMD XML topology file. Reads atom types,
masses, and charges if possible. Also reads bonds,
angles, and dihedrals.
|
GSD [1] |
政府物料供应处 |
类型、电荷、半径、质量键、角、二面体 |
HOOMD GSD拓扑文件。如果可能,读取原子类型、质量和电荷。还读取键、角和二面体。 |
MMTF [1] |
MMTF |
AltLocs,临时因素,费用,质量,名称,绑定,占用,类型,icodes,重命名,驻留,segids,型号 |
Macromolecular Transmission Format (MMTF) _。一种用于生物分子结构的高效紧凑格式。 |
FHIAIMS [1] |
在……里面 |
姓名 |
FHI-AIMS File Parser. Reads only the labels from
atoms and constructs minimal topology data.
|
5.1.1. 开发人员备注
在 0.8 版本加入.
在 0.16.0 版本发生变更: 新的基于阵列的拓扑系统完全取代了基于Atom实例列表的旧系统。
在 2.0.0 版本发生变更: ParmEdParser已移动到 converters
模块
拓扑信息由不随时间变化的数据组成,即对于轨迹的所有时间步长都相同的信息。这包括
原子的同一性(名称、类型、数量、部分电荷等)以及它们属于哪个残基和链段;在MDAnalysis中,原子由它们的
index
,一个从0开始的整数,按拓扑中原子的顺序递增。键(原子对)
角(原子的三元组)
二面角(原子的四元组)-适当的和不适当的二面体应该分开处理
在MDAnalysis中,拓扑读取器通常被称为“解析器”(出于历史原因,也是为了将它们与坐标“读取器”区分开来)。所有解析器都派生自 MDAnalysis.topology.base.TopologyReaderBase
并有一个 parse()
方法,它返回 MDAnalysis.core.topology.Topology
实例。
5.1.1.1. 原子
这个 原子 对用户显示为一组 Atom
实例。然而,在幕后,这基本上只是一个原子索引数组,用于索引拓扑数据库的各种组件 Topology
。解析器需要初始化 Topology
使用从拓扑文件中读取的数据。
参见
5.1.1.2. 债券
债券 表示为 tuple
的 tuple
。每个元组包含两个原子序数,这表明形成键的原子。只存储两个排列中的一个,通常先存储原子序数较低的那个。
5.1.1.3. 债权证
一些 债券 有更多信息被称为 订单 。如果可用,则将其存储在格式为{bondtuple:Order}的词典中。然后,这个额外的信息被传递给u._init_Bonds()中的Bond初始化
5.1.1.4. 角度
5.1.1.5. 二面体
适当的二面角 由一个 list
的 tuple
。每个元组包含四个原子序数。扭转的角度由原子1、2和3以及2、3和4形成的平面之间的角度定义。
5.1.1.6. 违规者
不正确的二面角 由一个 list
的 tuple
。每个元组包含四个原子序数。不适当扭转的角度也是由原子1、2和3以及2、3和4形成的平面之间的角度定义的。不适当的二面体不同于规则的二面体,因为四个原子不需要顺序键合,而通常都与第二个原子键合。