6月26日晚,生命中心2019年度第二次PI学术交流活动在北京大学吕志和楼三楼大厅举行,来自北大与清华两校近70名PI参加了本次学术交流。
活动由生命中心PI李海涛主持。首先,张强锋做了题为“Machine Intelligence for Structural Biology on DNA, RNA and Protein”的报告,介绍了当前人工智能方法在现实世界尤其是生物领域中所取得的成就,指出其背后的主要方法正是深度神经网络与大数据。接下来他详细介绍了其实验室开发的机器学习算法在DNA、RNA以及蛋白结构解析及相关功能分析方面的三个方面的工作:一是结合变分自编码器和混合高斯模型的single-cell ATAC-seq分析工具(SCALE)。SCALE基于相同类群之间的细胞数据相近的假设,利用高斯混合模型来近似细胞类群分布,并利用变分自编码器的编码器有效提取特征和解码器恢复出增强的数据,且可以富集具有细胞类群特异性相关的motif,并在此基础上做进一步的下游分析挖掘更多的生物学发现。其次,张强锋展示了深度神经网络模型在RNA结构分析上的应用,介绍了RNA结合蛋白(RBP)及RNA的结构参与细胞内很多重要的过程比如RNA转录,剪切以及翻译。其课题组利用深度学习模型,建立了一个基于in vivoRNA结构的预测RBP结合位点的新方法。该方法可找到关键的序列以及结构motif,预测出了潜在致病位点的蛋白结合差异、剪切差异。最后,他还讲述了基于深度神经网络设计的自动化从冷冻电子显微镜密度图搭建原子模型的方法(A²-Net)。该方法先通过三维卷积神经网络来识别氨基酸和蛋白质二级结构的方法,然后结合序列引导的蒙特卡洛搜索树,最终生成全原子模型。其速度非常快,是目前唯一的基于机器学习的搭建原子模型的方法。目前实验室继续在提升该方法的性能。报告后,Lucas、李海涛等多位PI和学生分别就这三个工作提出问题,进行了深入探讨。
接下来,胡家志以“From protein to DNA: regulation on B cell development”为题,介绍了他们在哺乳动物B细胞发生和发育过程中基因组稳定性的维持机制以及利用抗体库测序的方法筛选高特异性和高亲和力抗体的最新工作。课题组发现免疫相关的生物大分子的液-液相分离现象对淋巴细胞的发育和功能的正常发挥起着重要调控作用。他们发现AID蛋白具有相分离现象且该蛋白的相分离能负调节B细胞的发育过程,特别是抗体类型转换。他们还详实地阐明了AID蛋白相分离的分子机制,为进一步揭示相关免疫缺陷疾病的潜在发病机理及后续的干预治疗提供了新思路。与此同时,他们还开发了一种能高分辨率地鉴定DNA复制起始位点的新方法,进而确定了哺乳动物细胞的DNA早期复制起始的区域,厘清了DNA早期复制起始与转录的关系,并揭示了DNA早期复制对基因组稳定性的影响。最后,胡老师还介绍了他们开发的关于免疫组库测序的新方法,该方法可以高效、低成本及对用户友好地鉴定出对给定抗原具有高特异性和高亲和力的抗体,为科研和临床用抗体的筛选和疾病诊治提供了新的可能。在提问交流环节,中心PI孙前文和李晴就DNA复制与转录的关系提出了富有建设性的意见并给出了很好的建议。胡家志还与对抗体库的筛选原理以及应用感兴趣的PI们分享了课题的具体进展。
最后,谢晓亮以“Toward Decoding of Human Functional Genome”为题,介绍了其课题组发展的单细胞功能基因组学新技术和新发现。他首先介绍了北京大学北京未来基因诊断高精尖创新中心几位PI共同合作的GeACT(人类细胞基因组调控计划)项目,其旨在超越人类细胞图谱项目。之后谢晓亮介绍了几个运用于GeACT项目的新技术:第一个是其课题组去年发表的单细胞染色质构相捕获技术Dip-C,由于可以捕获更多的contacts和能区分父母本染色体,该技术第一次解析出人类二倍体细胞3D基因组。通过该技术发现拓扑结构域(TAD)在单细胞间存在异质性,并根据不同细胞类型3D基因组结构不同,实现利用染色质A/B区室进行细胞分型。随后介绍的是其课题组最近发展的高检测率单细胞转录组技术MALBAC-DT,将全基因组扩增方法MALBAC用于扩增转录组,提高了检测率和检测精度。利用基因表达的内在波动性,加上高灵敏度的单细胞转录组检测方法,能够计算全转录组基因间的相关性,最终发现12000个基因间形成多组的基因模块。这些基因模块内的基因共同执行某一生物学功能,不同细胞类型有着不同的基因模块。接着谢晓亮还展示了细菌和真核生物基因调控的差异,由于真核生物存在组蛋白和基因组大小差异,真核生物转录因子通过组合结合(combinatorial binding)的方式实现基因表达的特异性调控调控。要解码基因表达的调控,首先要知道调控每个基因的转录因子,因此课题组希望绘制出人类所有细胞类型转录因子结合图谱,即TF3C。他们通过MALBAC-DT计算转录因子的模块,发现一起工作的TF组合,加上ATAC-Seq提供的开放区域的信息,将启动子区域结合的TF数量可降至个位数,从而最终确定TF3C图谱。报告结束后,李海涛,李晴,宋艳等许多PI积极提问,大家共同就细胞命运决定,TF3C是否考虑cofactor,以及其课题组最新的单细胞染色质构相捕获结果进行了交流和讨论。
学术交流活动结束,虽然已经接近9点钟,但仍有意犹未尽的老师,留下来进行着探讨,为将来的合作研究做准备。