报告主题: 基于深度学习的植物基因关键核心元件的智能识别
报告人: 胡学海教授(华中农业大学)
报告时间:2023年10月20日(星期五)上午11:00-12:00
报告地点:37号楼3A02
邀请人: 李兵教授
欢迎广大师生前往!
数学学院
2023年10月18日
报告摘要:
当今生命科学研究正经历“从认识生命、改造生命走向合成生命、设计生命”的跨越阶段。现代生物育种正在实现从以整合遗传数据、组学数据为标志的育种3.0时代,到以基因编辑、机器学习、人工智能等多学科会聚为特征的育种4.0时代的跨越。现代育种已逐渐开始采用基因编辑技术,对已知功能的重要基因开展“启动子平铺删除式的饱和突变”策略来编辑关键调控位点,获取植物理想农艺性状。然而,此策略存在覆盖瓶颈和识别效率瓶颈,严重阻碍其更广泛的应用。本研究尝试使用数据驱动研究新范式去突破上述两个瓶颈。首先,我们利用120k的DNA序列构建了一个序列—表达的深度学习模型,并结合可解释性方法智能识别远端元件,有望解决覆盖瓶颈;进一步,我们使用基因近端的3k调控区序列构建了一个更小但更精细的模型,用来大规模智能识别近端的启动子元件,有望突破识别效率瓶颈。更重要的是,我们模型锁定了大量对目标基因表达贡献显著的DNA片段。根据这些片段,我们提出了一个“编辑可塑性”的概念,用来模拟敲除这些片段或它们的组合如何能影响基因表达变化的幅度。最后,我们将新开发的方法应用于AI引导下的育种:模型引导下的编辑玉米ZmVTE4的启动子区域,可以让玉米籽粒中维E含量提高10%。
专家简介:
胡学海,男,教授,博士生导师。2002年本科毕业于武汉大学数学系,2007年获武汉大学基础数学博士学位。2007年7月起在华中农业大学任讲师,2019年聘为博士生导师,2020年晋升为教授,2023年入选华中农业大学“狮山硕彦”拔尖人才。现任华中农业大学信息学院大数据科学系主任。2017全年在美国加州大学河滨分校做国家公派访问学者。长期从事基于深度学习的调控基因组及精准编辑方向,以及基于整合基因组、转录组、代谢组等多组学数据对植物复杂性状的机制解析、表型预测等统计遗传方法方向的研究。主持国家重点研究计划子课题一项,国家自然科学基金面上项目两项(32070689,11671003),青年基金一项(11001093),获批科研经费300多万元。发表科研论文20余篇,其中以第一或通讯作者发表SCI论文20余篇,分别发表在Plant Biotechnology Journal、Plant Communications、Bioinformatics、Briefings in Bioinformatics等国际刊物上,同时担任Plant Biotechnology Journal、The Plant Journal、Bioinformatics、BMC Genomics、Heredity等多个SCI期刊的审稿人。