【讲座通知】 | 基于健康医疗大数据的全基因组关联分析算法
来源:
时间:2026-05-28
点击量:次

【讲座通知】
公共卫生学院科研讲座
【主讲嘉宾】
毕文健 研究员
(北京大学)
【讲座主持】
郝兴杰 副教授
【讲座时间】
2026年5月29日(周五)下午15:00-17:00
【讲座主题】
基于健康医疗大数据的全基因组关联分析算法
【讲座地点】
公共卫生学院2号楼一楼112多媒体会议室
【讲者简介】
毕文健,北京大学基础医学院课题组长,研究员,北京大学博雅青年学者,博士生导师,国家级青年高层次人才计划入选者。2015年博士毕业于中国科学院数学与系统科学院研究院,后在美国圣裘德儿童研究医院、密歇根大学从事博士后研究,2021年6月入职北京大学基础医学院。主要工作涉及统计遗传学、生物统计与系统生物学、生物信息学等,针对基因-环境交互作用、生存数据和多分类表型数据设计了多种快速、准确的分析算法,并应用于大型生物样本库的实际数据中。以第一/通讯作者身份发表于Nature Genetics (2022), Nature Computational Science (2025, 2026), American Journal of Human Genetics (2019, 2020, 2021, 2023),Cell Reports Medicine (2025), Nature Communications (2025a, 2025b, 2025c), Genome Biology (2025), PLOS Genetics, Genetics, Biostatistics等学术杂志。主持国家自然科学基金海外优秀青年项目(300万)、重大疾病智慧诊疗专项项目(145万)、细胞生物学青年专项项目(58万)、面上项目(54万)、国际合作和交流项目(15万),北京市自然科学基金一般非共识创新项目(50万)等。
【讲座简介】
随着高通量测序技术、高精度成像技术以及电子健康记录系统的发展,生物医学进入了健康医疗信息化的大数据新时代。海量的生物医学大数据为系统生物学研究提供了丰富的研究资源。比如英国生物样本库收集了50万英国人的遗传、临床和其他健康数据并向全球科研人员开放。然而,针对健康医疗大数据的全基因组关联分析存在本质困难,亟需进行数学理论方法创新。针对传统方法在适用范围、分析精度和运算效率的不足,我们对核心算法进行理论创新,在“表型-遗传-环境”三个层次,解决了全基因组关联分析的多个重要问题:
(1)提出适用于复杂结构表型的通用框架,分析不再局限于连续/分类表型,显著拓展了适用范围。
(2)推广鞍点近似方法分析罕见变异位点,克服了传统方法的假阳性问题,提升了分析的准确性。
(3)利用矩阵投影提升基因-环境互作分析的运算效率,突破候选基因的局限,可以在全基因组尺度挖掘新发现