5.1. 拓扑阅读器 MDAnalysis.topology

此子模块包含拓扑读取器。拓扑文件提供系统中原子的列表、它们的连接性以及可能的附加信息,例如B因子、部分电荷等。细节取决于文件格式,并且并非每个拓扑文件都提供所有(或甚至任何)附加数据。这些数据可以通过原子组属性进行访问。

至少,所有拓扑解析器都将提供原子ID、原子类型、质量、残基、重新编号和编号,以及将所有原子分配给残基,将所有残基分配给片段。对于没有残基和链段的体系,这导致存在所有原子所属的单一残基和链段。当数据不是由文件提供时,通常会根据文件中的其他数据进行猜测。如果发生这种情况,将始终发出UserWarning。

下表列出了当前支持的拓扑格式及其提供的属性。

支持的拓扑格式表

名字

分机

属性

备注

CHARMM/XploR PSF

PSF

重新命名、名称、类型、电荷、键、角度、二面体、突破者

CHARMM/XPLOR/NAMD 拓扑格式; MDAnalysis.topology.PSFParser

CHARMM卡 [1]

CRD

名字,临时因素,更名,

“卡片”坐标输出自 CHARMM; 处理标准格式或扩展格式; MDAnalysis.topology.CRDParser

布鲁克海文 [1]

PDB/ENT

名称、债券、地址、重新编号、类型、链接、占有率、临时因素、地址、代码、重新命名、编号

默认情况下读取简化的PDB格式(如MD模拟中所用

XPDB [1]

PDB

作为pdb,但icodes除外

扩展的PDB格式如由例如, NAMD (可以使用5位残数)。要使用,请明确指定格式“xpbd”: Universe(..., topology_format="XPDB") 。模块 MDAnalysis.coordinates.PDB

PQR [1]

PQR

名称、费用、类型、半径、驻留、重命名、icodes、segids

类似PDB但以空格分隔的具有电荷和半径信息的文件,例如, APBS. MDAnalysis.topology.PQRParser

PDBQT [1]

PDBQT

名称、类型、altLocs、费用、重命名、居住地、icodes、占有率、临时因素、segid、

使用的文件格式 AutoDock 原子类型和部分电荷。模块: MDAnalysis.topology.PDBQTParser

GROMOS96 [1]

GRO

名字,居住地,更名,

GROMOS96坐标文件(例如,由 Gromacs) MDAnalysis.topology.GROParser

琥珀

Top、prmtop、parm7

名称、费用TYPE_INDEX、类型、重命名

简单 Amber 格式读取器(仅支持标志子集); MDAnalysis.topology.TOPParser

DESRES [1]

DMS

名称、编号、质量、费用、链接、驻留、更名、编号、半径、

DESRES分子结构阅读器(仅支持原子和键记录) Desmond 和安东; MDAnalysis.topology.DMSParser

TPR [2]

TPR

名称、类型、驻留、更名、费用、键合、质量、分子类型、分子数

Gromacs 便携式运行输入读取器(对一些较新版本的文件格式的有限实验支持); MDAnalysis.topology.TPRParser

ITP

ITP

名称、类型、驻留、重新命名、费用、绑定、质量、Segids、模具类型、计费组

Gromacs 包括拓扑图文件; MDAnalysis.topology.ITPParser

MOL2 [1]

钼2

身份证,姓名,类型,住所,费用,债券,更名,

TRIPOS MOL2分子结构格式; MDAnalysis.topology.MOL2Parser

LAMMPS [1]

数据

ID、类型、质量、电荷、残留物、键、角、二面体

LAMMPS 数据文件解析器 MDAnalysis.topology.LAMMPSParser

LAMMPS [1]

Lammps转储

ID、群众

LAMMPS ASCII转储文件读取器 MDAnalysis.topology.LAMMPSParser

XYZ [1]

XYZ

姓名

XYZ文件解析器。只从原子读取标签并构造最小的拓扑数据。 MDAnalysis.topology.XYZParser

TXYZ [1]

Txyz,圆弧

名称、原子、质量、类型、键

Tinker XYZ文件解析器。读取原子标签、数字和连接性;根据原子名称猜测质量。 MDAnalysis.topology.TXYZParser

GAMESS [1]

GM,日志

名字,原子电荷,

GAMESS 输出解析器。只读集合部分的原子(原子、元素和坐标)并构建拓扑。 MDAnalysis.topology.GMSParser

DL_POLY [1]

配置、历史记录

身份证,姓名

DL_POLY CONFIG or HISTORY file. Reads only the atom names. If atoms are written out of order, will correct the order. MDAnalysis.topology.DLPolyParser

Hoomd XML

XML

类型、电荷、半径、质量键、角、二面体

HOOMD XML topology file. Reads atom types, masses, and charges if possible. Also reads bonds, angles, and dihedrals. MDAnalysis.topology.HoomdXMLParser

GSD [1]

政府物料供应处

类型、电荷、半径、质量键、角、二面体

HOOMD GSD拓扑文件。如果可能,读取原子类型、质量和电荷。还读取键、角和二面体。 MDAnalysis.topology.GSDParser

MMTF [1]

MMTF

AltLocs,临时因素,费用,质量,名称,绑定,占用,类型,icodes,重命名,驻留,segids,型号

Macromolecular Transmission Format (MMTF) _。一种用于生物分子结构的高效紧凑格式。

FHIAIMS [1]

在……里面

姓名

FHI-AIMS File Parser. Reads only the labels from atoms and constructs minimal topology data. MDAnalysis.topology.FHIAIMSParser

5.1.1. 开发人员备注

在 0.8 版本加入.

在 0.16.0 版本发生变更: 新的基于阵列的拓扑系统完全取代了基于Atom实例列表的旧系统。

在 2.0.0 版本发生变更: ParmEdParser已移动到 converters 模块

拓扑信息由不随时间变化的数据组成,即对于轨迹的所有时间步长都相同的信息。这包括

  • 原子的同一性(名称、类型、数量、部分电荷等)以及它们属于哪个残基和链段;在MDAnalysis中,原子由它们的 index ,一个从0开始的整数,按拓扑中原子的顺序递增。

  • 键(原子对)

  • 角(原子的三元组)

  • 二面角(原子的四元组)-适当的和不适当的二面体应该分开处理

在MDAnalysis中,拓扑读取器通常被称为“解析器”(出于历史原因,也是为了将它们与坐标“读取器”区分开来)。所有解析器都派生自 MDAnalysis.topology.base.TopologyReaderBase 并有一个 parse() 方法,它返回 MDAnalysis.core.topology.Topology 实例。

5.1.1.1. 原子

这个 原子 对用户显示为一组 Atom 实例。然而,在幕后,这基本上只是一个原子索引数组,用于索引拓扑数据库的各种组件 Topology 。解析器需要初始化 Topology 使用从拓扑文件中读取的数据。

参见

拓扑系统

5.1.1.2. 债券

债券 表示为 tupletuple 。每个元组包含两个原子序数,这表明形成键的原子。只存储两个排列中的一个,通常先存储原子序数较低的那个。

5.1.1.3. 债权证

一些 债券 有更多信息被称为 订单 。如果可用,则将其存储在格式为{bondtuple:Order}的词典中。然后,这个额外的信息被传递给u._init_Bonds()中的Bond初始化

5.1.1.4. 角度

夹角 由一个 listtuple 。每个元组包含三个原子序数。这些数字中的第二个表示角度的顶点。

5.1.1.5. 二面体

适当的二面角 由一个 listtuple 。每个元组包含四个原子序数。扭转的角度由原子1、2和3以及2、3和4形成的平面之间的角度定义。

5.1.1.6. 违规者

不正确的二面角 由一个 listtuple 。每个元组包含四个原子序数。不适当扭转的角度也是由原子1、2和3以及2、3和4形成的平面之间的角度定义的。不适当的二面体不同于规则的二面体,因为四个原子不需要顺序键合,而通常都与第二个原子键合。