Bio.Motifs.transfac模块

正在解析TRANSFAC文件。

class Bio.motifs.transfac.Motif(alphabet='ACGT', instances=None, counts=None)

基类:Motif, dict

存储一个TRANSFAC主题的信息。

此类继承自Bio.Motifs.Motif基类,也继承自Python字典。如果可能,解析器找到的所有Motif信息都存储为基类的属性;有关这些属性的描述,请参阅Bio.Motifs.Motif基类。与主题相关联的所有其他信息都以(键、值)对的形式存储在字典中,其中键是在TRANSFAC文件中找到的两个字母的字段。引用是一个例外:它们存储在.references属性中。

这些字段通常位于TRANSFAC文件中::

AC:    Accession number
AS:    Accession numbers, secondary
BA:    Statistical basis
BF:    Binding factors
BS:    Factor binding sites underlying the matrix
       [sequence; SITE accession number; start position for matrix
       sequence; length of sequence used; number of gaps inserted;
       strand orientation.]
CC:    Comments
CO:    Copyright notice
DE:    Short factor description
DR:    External databases
       [database name: database accession number]
DT:    Date created/updated
HC:    Subfamilies
HP:    Superfamilies
ID:    Identifier
NA:    Name of the binding factor
OC:    Taxonomic classification
OS:    Species/Taxon
OV:    Older version
PV:    Preferred version
TY:    Type
XX:    Empty line; these are not stored in the Record.

引用存储在.reference属性中,该属性是具有以下键的字典列表:

RN:    Reference number
RA:    Reference authors
RL:    Reference data
RT:    Reference title
RX:    PubMed ID

有关详细信息,请参阅TRANSFAC文档。

multiple_value_keys = {'BF', 'BS', 'DR', 'DT', 'HC', 'HP', 'OV'}
reference_keys = {'RA', 'RL', 'RT', 'RX'}
class Bio.motifs.transfac.Record

基类:list

将信息存储在TRANSFAC矩阵表中。

该记录继承自包含各个主题的列表。

属性:
  • 版本-版本号,对应于TRANSFAC文件中的‘VV’字段;

__init__()

初始化类。

__str__()

将TRANSFAC矩阵转换为字符串。

Bio.motifs.transfac.read(handle, strict=True)

将Transfac格式句柄解析为记录对象。

Bio.motifs.transfac.write(motifs)

以TRANSFAC格式编写主题的表示形式。