近日,中国科学院北京基因组研究所生命与健康大数据中心团队题为“The BIG Data Center: from deposition to integration to translation”(北京基因组研究所生命与健康大数据中心:从存储到整合、再到转化)的研究论文被国际学术期刊《核酸研究》(Nucleic Acids Research)在线发表。这是我国首次以数据中心为模式整体发布我国生命组学数据资源建设情况,标志着我国建设综合性基因组数据资源获得国际同行认可。
北京基因组研究所有关人员表示,此前,国际上被认可的生物组学数据中心主要有美国的NCBI、欧洲的EBI及日本的DDBJ,要想在国际期刊发表论文,需要先将自己的原始数据提交到这三个官方指定的数据库中。“中国的生物组学数据产量约占全球的40%,是数据产出大国,却没有能够被国际认可的数据库系统,不得不将自己宝贵的数据资源交给他人代管。”
该数据库成为国际上第四个被认可的生物组学数据库。现在包括PNAS(美国国家科学院院刊)、Cell Research(细胞研究)等核心期刊在内的多个国际期刊已经认可把数据提交到BIGD。
北京基因组研究所生命与健康大数据中心(BIG Data Center)肩负建成面向国家大数据发展战略的多层次生物组学数据资源系统的重要历史使命。目前的数据资源系统包括高通量测序的原始组学数据归档库GSA,围绕国家重要战略生物资源的基因组组数据库GWH,基于测序数据的基因表达数据库GEN,基于中国人群以及国家重要物种群体的基因组变异数据库GVM,基于全基因组DNA甲基化图谱的表观基因组数据库MethBank以及基于大众审编的生命科学维基知识库Science Wikis,初步形成了我国生命与健康数据汇交与共享平台,具备可服务于全球的基因组数据共享网络。(赵竹青)