Bio.ExPasy.Cellosaurus模块

ExPAS中的cellosaurus.url文件的解析器。

请参阅https://web.expasy.org/cellosaurus/

使用版本18(2016年7月)进行测试。

功能:
  • 读 读取包含一个细胞系条目的文件

  • 解析 读取包含多个单元行条目的文件

职业:
  • 记录 保存细胞系数据。

示例

此示例下载Cellosaurus数据库并对其进行解析。请注意,urlopen返回字节流,而解析器期望纯字符串流,因此我们使用TextIOWrapper将字节转换为UTF-8编码的字符串。如果您提前下载cellosaurus. url文件并打开它,则不需要此操作(请参阅下面的评论)。

>>> from urllib.request import urlopen
>>> from io import TextIOWrapper
>>> from Bio.ExPASy import cellosaurus
>>> url = "ftp://ftp.expasy.org/databases/cellosaurus/cellosaurus.txt"
>>> bytestream = urlopen(url)
>>> textstream = TextIOWrapper(bytestream, "UTF-8")
>>> # alternatively, use
>>> # textstream = open("cellosaurus.txt")
>>> # if you downloaded the cellosaurus.txt file in advance.
>>> records = cellosaurus.parse(textstream)
>>> for record in records:
...     if 'Homo sapiens' in record['OX'][0]:
...         print(record['ID'])
...
#15310-LN
#W7079
(L)PC6
0.5alpha
...
Bio.ExPASy.cellosaurus.parse(handle)

解析细胞系记录。

该功能用于解析包含多个记录的细胞系文件。

论点:
  • 手柄 - 文件的处理。

Bio.ExPASy.cellosaurus.read(handle)

阅读一份细胞系记录。

该功能用于解析恰好包含一条记录的细胞系文件。

论点:
  • 手柄 - 文件的处理。

class Bio.ExPASy.cellosaurus.Record

基类:dict

将ExPASy Cellosaurus记录中的信息保存为Python字典。

每条记录包含以下密钥:

线路码

内容

条目中的发生

ID

标识符(细胞系名称)

一次;开始条目

AC

加入(CVCL_xxxx)

一旦

AS

二级登录号

可选;一次

SY

同义词

可选;一次

DR

交叉引用

可选;一次或多次

RX

参考标识符

可选:一次或多次

WW

网页

可选;一次或多次

CC

评论

可选;一次或多次

ST

SNP概况数据

可选;两次或更多

DI

疾病

可选;一次或多次

OX

物种来源

一次或多次

HI

层次结构

可选;一次或多次

OI

起源于同一个人

可选;一次或多次

SX

细胞性别

可选;一次

AG

抽样时捐赠者年龄

可选;一次

CA

类别

一旦

DT

日期(参赛历史)

一旦

//

终结者

一次;结束条目

__init__()

初始化课程。

__repr__()

返回Record对象的规范字符串表示形式。

__str__()

返回Record对象的可读字符串表示形式。

__firstlineno__ = 85
__static_attributes__ = ()