May 03 2012

用正则表达式识别数据库IDs/Accession Numbers

生物数据库多如牛毛,而不同的数据库可能采用各异的 ID/Accession Number (以下简称 ID/ACC)来标识里面的记录,免不了眼花缭乱~

所以,试着用正则表达式来表达这些 ID/ACCs,目标是每一个数据库可以拥有独特的、只匹配相应数据库 ID/ACCs 的正则表达式~ (假设每一行的内容对应一个ID/ACC)

ArrayExpress: ^[AE]-[A-Z]{4}-\d+$ (eg: E-TABM-518, A-AFFY-5)
BioSample: ^SAMEG?\d{6}$ (eg: SAME058933, SAMEG038449) 阅读全文 »

分类: 学习 | 标签: , | 2 回复 »

Mar 19 2012

《精通法式烹饪艺术》—— 葡萄酒

这篇文章翻译的是 Simone Beck, Louisette BertholleJulia Child 合著的《Mastering the Art of French Cooking》(MAoFC, 1961年版)之葡萄酒部分。

距离上一次翻译刀法部分已过了大半年… So little time, so much to do… 以后的翻译进度可能会继续缓慢…

说到葡萄酒,大概有许多人喜欢,诸如“每天一杯葡萄酒好处多多”的说法也是很流行的~ 对于葡萄酒,我们很多人都是门外汉,本书的这一部分向我们传授了葡萄酒的若干基础知识,重点讲述法国葡萄酒与食物的搭配。
阅读全文 »

分类: 其他 | 标签: , | 2 回复 »

Feb 24 2012

寻找PDB数据库中只存在单个位点差异的蛋白质组合

BioStar 上面有一个问题:“How to return all pdb ids to a given one that differ only by one amino acid?

问题即:给定一条蛋白质序列,从 PDB 数据库含有的蛋白质中找出所有与其只存在单个位点差异的序列。再推广,即找出只存在单个位点差异的所有蛋白质组合。

nsaunders 在其博客中给出了详细的解决方案,跟随其步骤,实践一下。

1. 从 NCBI 获取 PDB 数据库中的蛋白质序列(FASTA 格式)

下载、解压

$ wget ftp://ftp.ncbi.gov/blast/db/FASTA/pdbaa.gz
$ gunzip pdbaa.gz

阅读全文 »

分类: 学习 | 标签: , , | 1 回复 »

Jan 04 2012

Jessie下厨房合集@2011

过去的一年,用四个字概括 —— 悲喜交加。

Anyway, past 即历史。Time is something we will never get back.

收获无几,厨艺倒可能有所提高。

2011年偶下厨房的不完全合集如下:(2p)

阅读全文 »

分类: 生活 | 标签: | 6 回复 »

Dec 23 2011

Kindle 4 使用体验

上一次买Kindle 3的时候($139),爱不释手,可惜没用上一个月就在搬家的过程中连同皮套、包装盒、数据线和说明书等一起消失了…  心痛之余,也木有他法。听闻另一位师兄要从米国回来,便拜托其带个Kindle 4。选择最便宜的非触摸屏广告版,$79,折合人民币¥500。

因为用过K3,所以新拿到K4使用起来亦熟门熟路,开箱、注册。同K3相比,亦发现了若干处不同~

K4去掉了K3的键盘,只保留5个按键,按键两旁的空白处适合手持;开关键由滑动键变成按键;机身更轻、更小。我的手比较小,但依然可以用一只手握住两侧~

阅读全文 »

无觅相关文章插件,快速提升流量

分类: 生活 | 标签: | 4 回复 »