数据管理与分析平台旨在建立“汇-通-管-用-评”五位一体的标准化大数据信息平台。汇聚生物样本库数据、流行病学数据、基因数据、临床数据、生物标志物数据等异构数据。通过统一标准、深度治理等实现数据治理融合贯通,并对全量数据资产进行标准化、标签化管理,通过数据智能应用服务支撑数据开发、算法开发等各类科研项目,通过数据权限分级,服务于业务人员、运维人员、数据管理员和科研团队等不同用户角色,探索和推动共享平台建设。并通过数据汇聚评估、数据质量评估和数据使用评估提升大数据信息平台的质量。

目前已搭建三组数据分析计算专用高性能服务器集群, 共7PB存储空间,且后期根据使用需求可继续扩容升级,采用双冗余控制系统,防火墙,数据备份系统及UPS不间断电源,具备国内领先的超级计算能力及容灾性能。目前已经存储全基因组数据达500TB。同时为包含210多万人次体检、总人数超过100万的健康体检大数据平台提供支撑。可实现浙江大学紫金港机房与全国范围内各医疗机构数据的同步传输和异地备份。在超强计算机算力的加持下,在该平台上,利用高端的生物信息和生物统计方法,可以帮助建立覆盖肿瘤全链条的个体化风险预测模型,并转成一系列个人疾病风险预测人工智能工具;为建立了高危人群早期识别方法提供强有力的技术支持。