标记方阵格式 (skbio.io.format.lsmat

带标签的方阵文件格式 (lsmat )存储与沿每个轴的一组对象相关的数值方阵数据。该格式还存储对象的标识符(即唯一标签)。矩阵数据和标识符以分隔文本格式(如TSV或CSV)存储。这种格式支持存储多种数据类型,包括差异/距离矩阵、相似性矩阵和氨基酸替代矩阵。

格式支持

有嗅探员:是的

读者

writer

对象类

是的

是的

skbio.stats.distance.DissimilarityMatrix

是的

是的

skbio.stats.distance.DistanceMatrix

格式规范

标记的方阵和对象标识符存储为分隔文本。文件的第一行是头,它必须以分隔符开头,后跟矩阵中所有对象的ID。下面的每一行都必须包含一个对象的ID,后跟一个数字(float或integer)向量,该向量将对象与矩阵中的所有其他对象相关联。对象的顺序由标头中的ID决定。

例如,假设我们有一个2x2的距离矩阵和id 'a''b' . 以这种格式序列化时,距离矩阵可能如下所示:

<del>a<del>b
a<del>0.0<del>1.0
b<del>1.0<del>0.0

在哪里? <del> 元素之间的分隔符。

只包含空格的行可能出现在整个文件的任何位置,并被忽略。以开头的行 # 被视为注释并被忽略。评论只能出现 之前 标题。

在分析ID时,将删除所有前导/尾随空格。

备注

这种文件格式对于存储小矩阵非常有用,或者当需要以人类可读的格式表示矩阵时,或者容易地将文件导入另一个支持分隔文本的程序(例如,电子表格程序)。如果考虑到效率,这种格式可能不是最合适的选择。

格式参数

唯一支持的格式参数是 delimiter ,默认为制表符 ('\t'delimiter 用于分隔文件格式中的元素。 delimiter 在读取或写入文件时,可以指定为关键字参数。