生命与健康大数据中心(BIG Data Center;简称BIGD)是研究所科研、支撑体系的一部分,其发展目标为面向我国人口健康和社会可持续发展的重大战略需求,围绕国家精准医学和重要战略生物资源的组学数据,建立海量生物组学大数据储存、整合与挖掘分析研究体系,发展组学大数据系统构建、挖掘与分析的新技术、新方法,建设组学大数据汇交、应用与共享平台,力争建成支撑我国生命科学发展、国际知名的生命与健康大数据中心。
生命与健康大数据中心目前拥有30余人的工作团队,具备5000个以上CPU计算核心及总容量超过8PB数据存储资源,已经开发形成一系列的多组学数据库系统,近期工作主要围绕三大方向:第一,面向中国人群普惠健康的精准医学组学信息资源,建立中国人群的参比基因组、遗传变异图谱,形成中国人群组学信息库;第二,基于高通量测序的海量原始组学数据资源,建立符合国际标准的原始组学数据归档库,形成中国原始组学数据的共享平台;第三,围绕国家重要战略生物资源,建立海量组学数据的整合、挖掘与应用体系,形成综合性的多组学数据库系统。