Bio.ExPasy.Cellosaurus模块
ExPAS中的cellosaurus.url文件的解析器。
请参阅https://web.expasy.org/cellosaurus/
使用版本18(2016年7月)进行测试。
- 功能:
读 读取包含一个细胞系条目的文件
解析 读取包含多个单元行条目的文件
- 职业:
记录 保存细胞系数据。
示例
此示例下载Cellosaurus数据库并对其进行解析。请注意,urlopen返回字节流,而解析器期望纯字符串流,因此我们使用TextIOWrapper将字节转换为UTF-8编码的字符串。如果您提前下载cellosaurus. url文件并打开它,则不需要此操作(请参阅下面的评论)。
>>> from urllib.request import urlopen
>>> from io import TextIOWrapper
>>> from Bio.ExPASy import cellosaurus
>>> url = "ftp://ftp.expasy.org/databases/cellosaurus/cellosaurus.txt"
>>> bytestream = urlopen(url)
>>> textstream = TextIOWrapper(bytestream, "UTF-8")
>>> # alternatively, use
>>> # textstream = open("cellosaurus.txt")
>>> # if you downloaded the cellosaurus.txt file in advance.
>>> records = cellosaurus.parse(textstream)
>>> for record in records:
... if 'Homo sapiens' in record['OX'][0]:
... print(record['ID'])
...
#15310-LN
#W7079
(L)PC6
0.5alpha
...
- Bio.ExPASy.cellosaurus.parse(handle)
解析细胞系记录。
该功能用于解析包含多个记录的细胞系文件。
- 论点:
手柄 - 文件的处理。
- Bio.ExPASy.cellosaurus.read(handle)
阅读一份细胞系记录。
该功能用于解析恰好包含一条记录的细胞系文件。
- 论点:
手柄 - 文件的处理。
- class Bio.ExPASy.cellosaurus.Record
基类:
dict
将ExPASy Cellosaurus记录中的信息保存为Python字典。
每条记录包含以下密钥:
线路码
内容
条目中的发生
ID
标识符(细胞系名称)
一次;开始条目
AC
加入(CVCL_xxxx)
一旦
AS
二级登录号
可选;一次
SY
同义词
可选;一次
DR
交叉引用
可选;一次或多次
RX
参考标识符
可选:一次或多次
WW
网页
可选;一次或多次
CC
评论
可选;一次或多次
ST
SNP概况数据
可选;两次或更多
DI
疾病
可选;一次或多次
OX
物种来源
一次或多次
HI
层次结构
可选;一次或多次
OI
起源于同一个人
可选;一次或多次
SX
细胞性别
可选;一次
AG
抽样时捐赠者年龄
可选;一次
CA
类别
一旦
DT
日期(参赛历史)
一旦
//
终结者
一次;结束条目
- __init__()
初始化课程。
- __repr__()
返回Record对象的规范字符串表示形式。
- __str__()
返回Record对象的可读字符串表示形式。
- __firstlineno__ = 85
- __static_attributes__ = ()