标记方阵格式 (skbio.io.format.lsmat
)¶
带标签的方阵文件格式 (lsmat
)存储与沿每个轴的一组对象相关的数值方阵数据。该格式还存储对象的标识符(即唯一标签)。矩阵数据和标识符以分隔文本格式(如TSV或CSV)存储。这种格式支持存储多种数据类型,包括差异/距离矩阵、相似性矩阵和氨基酸替代矩阵。
格式支持¶
有嗅探员:是的
读者 |
writer |
对象类 |
---|---|---|
是的 |
是的 |
|
是的 |
是的 |
格式规范¶
标记的方阵和对象标识符存储为分隔文本。文件的第一行是头,它必须以分隔符开头,后跟矩阵中所有对象的ID。下面的每一行都必须包含一个对象的ID,后跟一个数字(float或integer)向量,该向量将对象与矩阵中的所有其他对象相关联。对象的顺序由标头中的ID决定。
例如,假设我们有一个2x2的距离矩阵和id 'a'
和 'b'
. 以这种格式序列化时,距离矩阵可能如下所示:
<del>a<del>b
a<del>0.0<del>1.0
b<del>1.0<del>0.0
在哪里? <del>
元素之间的分隔符。
只包含空格的行可能出现在整个文件的任何位置,并被忽略。以开头的行 #
被视为注释并被忽略。评论只能出现 之前 标题。
在分析ID时,将删除所有前导/尾随空格。
备注
这种文件格式对于存储小矩阵非常有用,或者当需要以人类可读的格式表示矩阵时,或者容易地将文件导入另一个支持分隔文本的程序(例如,电子表格程序)。如果考虑到效率,这种格式可能不是最合适的选择。
格式参数¶
唯一支持的格式参数是 delimiter
,默认为制表符 ('\t'
) delimiter
用于分隔文件格式中的元素。 delimiter
在读取或写入文件时,可以指定为关键字参数。