Bio.ExPasy.Cellosaurus模块

ExPAS中的cellosaurus.url文件的解析器。

请参阅https://web.expasy.org/cellosaurus/

使用版本18（2016年7月）进行测试。

功能：

读读取包含一个细胞系条目的文件
解析读取包含多个单元行条目的文件

职业：

记录保存细胞系数据。

示例

此示例下载Cellosaurus数据库并对其进行解析。请注意，urlopen返回字节流，而解析器期望纯字符串流，因此我们使用TextIOWrapper将字节转换为UTF-8编码的字符串。如果您提前下载cellosaurus. url文件并打开它，则不需要此操作（请参阅下面的评论）。

>>> from urllib.request import urlopen
>>> from io import TextIOWrapper
>>> from Bio.ExPASy import cellosaurus
>>> url = "ftp://ftp.expasy.org/databases/cellosaurus/cellosaurus.txt"
>>> bytestream = urlopen(url)
>>> textstream = TextIOWrapper(bytestream, "UTF-8")
>>> # alternatively, use
>>> # textstream = open("cellosaurus.txt")
>>> # if you downloaded the cellosaurus.txt file in advance.
>>> records = cellosaurus.parse(textstream)
>>> for record in records:
...     if 'Homo sapiens' in record['OX'][0]:
...         print(record['ID'])
...
#15310-LN
#W7079
(L)PC6
0.5alpha
...

Bio.ExPASy.cellosaurus.parse(handle)

解析细胞系记录。

该功能用于解析包含多个记录的细胞系文件。

论点：

手柄 - 文件的处理。

Bio.ExPASy.cellosaurus.read(handle)

阅读一份细胞系记录。

该功能用于解析恰好包含一条记录的细胞系文件。

论点：

手柄 - 文件的处理。

class Bio.ExPASy.cellosaurus.Record

基类：dict

将ExPASy Cellosaurus记录中的信息保存为Python字典。

每条记录包含以下密钥：

线路码	内容	条目中的发生
ID	标识符（细胞系名称）	一次;开始条目
AC	加入（CVCL_xxxx）	一旦
AS	二级登录号	可选;一次
SY	同义词	可选;一次
DR	交叉引用	可选;一次或多次
RX	参考标识符	可选：一次或多次
WW	网页	可选;一次或多次
CC	评论	可选;一次或多次
ST	SNP概况数据	可选;两次或更多
DI	疾病	可选;一次或多次
OX	物种来源	一次或多次
HI	层次结构	可选;一次或多次
OI	起源于同一个人	可选;一次或多次
SX	细胞性别	可选;一次
AG	抽样时捐赠者年龄	可选;一次
CA	类别	一旦
DT	日期（参赛历史）	一旦
//	终结者	一次;结束条目

__init__(): 初始化课程。

__repr__(): 返回Record对象的规范字符串表示形式。

__str__(): 返回Record对象的可读字符串表示形式。

__firstlineno__ = 85

__static_attributes__ = ()