在生活中,Google提供的Google Search, Google Docs, Google Apps等已让我们大为使用;在science领域,Google居然也能让人大为吃惊。继2009年他们在顶级杂志Nature发表一文讲述基于搜索字词数据(search query)预测流感趋势,开发了“Google流感趋势”软件后,2010年12月16日,另一顶级杂志Science发表了Google Books Team与Harvard大学两名研究人员(Erez Lieberman Aiden & Jean-Baptiste Michel)共同开发的一套数据库:Culturomics.
多年前,人们就知道组学时代(-omics)已来临。继genomics, proteomics, transcriptomics等组学一一产生后,culturomics (文化组学)也诞生了~!
Google对将近520万本数字图书进行了摘选,从而建立起庞大的数据库。该数据库包含20亿个单词/短语选自1800至2000年间出版的各种书籍,语种包括英语、法语、西班牙语、德语、汉语、俄语和希伯来语,可以对历年的单词和短语使用频率进行统计,从而了解文化和语言的变迁过程。此外,其还提供一款简单的网络工具,让所有电脑用户(不仅仅是学者)都可以输入自己感兴趣的单词,从而了解其历年来使用频率,得到一个折线图。



