科学家从器官中提取的27576个血管内皮细胞的UMAP可视化图。图片来源:课题组
图片来源:Dani Bergey
生命的产生是一个神奇的过程,经历了受精卵分裂、胚胎发育和胎儿生长。其间伴随着全身器官的发育和成熟,以及成百上千种细胞的扩增和分化,这决定了生物体的后期功能。
近日,美国洛克菲勒大学助理教授曹俊越因其在高通量单细胞测序技术以及发育生物学方面的成就,成为《科学》和SciLifeLab颁发的2020年度青年科学家奖特等奖全球唯一得主。11月20日,《科学》刊登了其获奖短文,描述了有助于研究生命产生奥秘的4项高通量单细胞测序技术。
之前,11月13日,《科学》还刊登了洛克菲勒大学、华盛顿大学医学院、罗特曼·巴蒂研究所等机构研究人员利用这些新技术创造的两个细胞图谱,以追踪人类细胞类型和组织发育过程中的基因表达和染色质可及性。
从失败中完善
“细胞是生物体结构和功能的最基本单位,为了解生命的产生过程,我们需要系统性地分析人体每一种细胞种类及其在发育过程中的动态变化和分子机理。”曹俊越在接受《中国科学报》专访时表示,而传统手段受限于检测的灵敏性,无法对人体的几百种细胞进行全面检测和比较。
近几年,单细胞测序技术,尤其是单细胞转录组测序技术,通过同时检测单细胞几万种基因的表达,精确定义了细胞的分子学状态,从而被广泛应用于检测新的细胞种类,以及研究发育和疾病对细胞状态的影响。但目前的单细胞测序技术只能检测几千个细胞,远远低于正常人体组织包含的细胞数目(百万级),同时耗材费用昂贵,因此无法全面检测人体组织中的细胞种类和变化。
为了解决这一问题,在华盛顿大学Jay Shendure实验室4年读博研究期间,曹俊越研发了高通量单细胞转录组测序技术(sci-RNA-seq)等4项高通量单细胞测序技术。
“相对于传统的生物学领域,新技术研发的困难主要在于要发明自然界中不存在的新事物,因此这一过程风险很高,往往要经历很多失败和挫折。”曹俊越回忆道,在研发sci-RNA-seq的最初过程中,他用两年时间反复尝试了262种实验条件才摸索出最初的技术雏形。
之后,研究人员又实验了超过1718种条件组合来优化sci-RNA-seq,从而使这项技术可以真正用来分析上百万个单细胞的基因表达图谱。“大部分的实验都没有成功,但是没有这些失败和汗水,也就没有最终完善的技术。”曹俊越说。
终于,基于组合标记的sci-RNA-seq实现了不依赖于细胞分离的单细胞基因表达检测。
4项技术
sci-RNA-seq被用于检测超过5万个线虫单细胞的转录组测序,从而构建了世界首个生物个体水平的单细胞转录组图谱。研究人员绘制了27个主要细胞种类的基因表达图谱,并监测到各种罕见的神经细胞种类。这些数据不仅在线虫研究领域具有重大意义,而且为构建其他生物物种的细胞转录组图谱提供了模板。
相对于线虫,哺乳动物包括人的发育过程涉及更加多样的细胞类型和复杂的分子程序。曹俊越等人研发了另一项高通量单细胞测序技术:sci-RNA-seq3。该技术可以同时检测几百万个单细胞转录图谱,其费用是以往技术的1/10。同时这项技术不依赖于特殊的仪器设备,可以广泛应用于世界大部分研究机构。
研究人员首先用这项技术对小鼠主要器官的发育阶段(胚胎期9.5天至13.5天)进行高精度单细胞水平的系统性研究。他们一共检测到200万个单细胞组成的500多个细胞种类,并系统性绘制了形成各种器官的细胞分化路径以及每个路径中几万种基因的表达变化。
针对目前大部分单细胞测序技术只能检测基因表达而忽略其他分子水平变化的局限,曹俊越等人又研发了高通量单细胞双图谱测序技术sci-CAR,可以同时检测上万个单细胞的转录组和染色质可及性数据,并成功构建首个哺乳动物器官水平(肾脏)的单细胞双图谱。
此外,目前的单细胞测序技术依然局限于描述细胞的静态而忽略了动态变化。延时显微镜可以通过实验测量细胞的动态转变,但仅限于研究培养皿中少数细胞的少数标记基因,因此可能不足以解释许多生物系统的复杂性。为此,曹俊越发明了sci-fate技术,用于研究大量单细胞在转录组水平的基因表达动态。这项技术通过结合sci-RNA-seq和4-硫尿苷(4sU)标记新生mRNA技术,可以大规模分析几千到几百万个单细胞转录组。
2017年至2020年,上述几项成果发表于《自然》《科学》和《自然—生物技术》。
两个图谱
近日,研究人员使用这些技术,绘制了两份新的图谱:15种胎儿组织单个细胞内的基因表达图谱和细胞内单个基因染色质可及性图谱。
基因表达是细胞使用储存在DNA中的指令指导蛋白质合成的过程。而这些蛋白质又决定了细胞的结构和功能。基因表达图谱绘制了不同类型细胞生长发育过程中发生基因表达的时间和地点。
华盛顿大学医学院基因组学教授Jay Shendure告诉记者:“这一领域的总体目标是在尽可能大的范围内,以尽可能高的分辨率描绘人体遗传程序。”
为了绘制图谱,研究人员使用sci-RNA-seq3技术,对15种胎儿组织的基因表达进行了分析。科学家分析了400多万个单细胞,确定了77种主要细胞类型和大约650个细胞亚型。研究发现了一些新的细胞种类,并综合分析了主要细胞类型(包括血液、内皮细胞和上皮细胞)的器官特异性。
他们将人类胎儿单细胞图谱和小鼠胚胎细胞图谱整合在一起,并构建了细胞和基因从胚胎到胎儿发育的动态轨迹。华盛顿大学医学院基因组学副教授Cole Trapnell表示:“把这些数据和之前发表的数据结合起来,可以直接描绘出所有主要细胞类型的细胞发育路径。”
第二份DNA可及性图谱绘制了一种名为染色质的物质,这种物质允许DNA紧密地排列在细胞核内。“研究染色质能让你了解细胞的调控‘语法’。”亚利桑那大学助理教授Darren Cusanovich说。
在这项研究中,科学家在15种胎儿组织的约100万个位点上生成了近80万个单细胞染色质可及性图谱。他们分析了哪些蛋白质可能与每个细胞中的DNA位点相互作用,以及这些相互作用如何解释细胞类型。这种分析定义了基因组内发育的控制开关。他们还确定了染色质易接近的位点,这些位点可能与疾病有关。
“每一项新技术都是一扇新的窗户,使我们可以领略这个世界独一无二的风景。通过研发更先进的技术,我们可以不断超越前人和自己的局限性,同时用这些新技术探索生命的奥秘和美丽。”曹俊越说。(来源:中国科学报 唐凤)
相关论文信息:http://dx.doi.org/10.1126/science.abf1686
http://dx.doi.org/10.1126/science.aba7721
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。