为深入贯彻落实“健康中国”战略,浙江大学在浙江省省委省政府的支持下,由浙江大学牵头,联合浙江省疾病预防控制中心和浙江省肿瘤医院,建设“健康浙江百万人群队列”。该项目旨在通过构建超大规模人群队列,着力打造我国首个百万级人群队列及全球顶尖的高能级科创平台。这一跨学科、跨领域的重大科研项目将为精准健康和数字健康的发展提供强力支撑。项目首席科学家吴息凤教授是国家级特聘专家、长江学者讲席教授,她在健康医疗大数据、生物遗传学、流行病学、精准医学等领域具有深厚的学术造诣和丰富的实践经验。

“健康浙江百万人群队列”计划招募100万人,覆盖自然人群、高危人群及重大慢病/癌症人群,收集包括微观的基因组、蛋白组等生物分子信息、中观的个人生活方式、体检及临床诊疗等信息,以及宏观的环境及社会因素等多维度数据,并进行长期追踪随访参与者的健康结局。基于跨尺度多模态健康医疗大数据,实现疾病“预防-诊断-治疗-预后”的基础研究突破,构建数智赋能的疾病防诊治与健康管理体系,提升全民健康。该项目拥有“全链条” “多维度”“前沿性”“动态性”“高质量”“应用性”等特有优势。同时,为确保优质的数据获取、存储和分析,项目建成了“现场-实验室-数据分析”全流程布局的干湿实验室,包括400万样本量的自动化生物样本库,一站式样本处理-核酸提取-建库测序-转录-蛋白-代谢检测平台,高性能服务器集群,以及“汇-通-管-用-评”五位一体的标准化大数据信息平台。

项目团队重点开展了以下五个方向的研究并取得一系列前沿创新成果,包括“跨尺度多模态健康医疗大数据获取、融合与辨析技术研究”、“高维度生物信息精准检测及智能计算”、“可改变风险因素精准鉴定及健康效应评价”、“基于关键场景健康医疗大数据融合辨识的慢性病精准防诊治”,以及“多学科交叉协同的智慧公卫治理示范应用”。

面向大数据获取融合与辨析,项目团队创新了一系列医学人工智能技术,包括数据处理流程、多维关系挖掘、解决方案构建和治理能力提升等方面。开展了3万人的WGS测序分析,复现了6个与非小细胞肺癌相关的遗传位点,并通过以低频及罕见变异为基础的分析,发现并验证了9个与非小细胞肺癌相关的新的易感基因,并绘制一系列表型的全基因组遗传变异图谱,填补了我国汉族人群全基因组低频及罕见变异与表型关系研究的空白,大幅加深了对重大慢性病相关表型遗传易感性的理解。探究了极端温度、空气污染和建筑环境特征对健康的影响,例如发现了工作地点周围15分钟步行范围内的室外绿地水平与代谢综合征风险降低相关联。构建了覆盖癌症发生、疗效、毒性、复发预后全链条的一系列个体化预测模型,并于近期开发并验证了首个基于50万人体检队列的泛癌风险预测机器学习模型,取得了良好的识别能力。构建了一系列衰老评估模型,并且分析了衰老加速的影响因素和健康效应,如发现了衰老加速程度最高的男性人群比最低的人群少活17年。

总的来说,本项目将有效收集、融合辨析及转化利用海量跨尺度多模态健康医疗大数据,站在世界一流平台上,实现基础研究突破、居民健康支持,助力建设健康浙江、打造重要窗口和高质量发展建设共同富裕示范区;助力健康中国、数字中国建设,以及人类卫生健康共同体建设。