斑马鱼胚胎形成过程中发育轨迹的单细胞重构

Introduction

胚胎形成过程中,单个全能干细胞能够产生大量具有不同功能、形态以及空间位置的细胞类型。由于该过程主要受转录调控,因此鉴定细胞命运获得背后的转录状态对于理解和操控发育至关重要。scRNA-seq 技术的出现使得我们能够探索单个胚胎细胞的转录组状态,然而,大量的细胞和分叉点,以及发育过程中的不同步,给全面鉴定细胞类型以及重构发育轨迹带来了巨大的挑战。此前开发的一些计算方法要么针对静态或稳态过程,要么只能处理少量分叉点,因此不适用于处理复杂分叉结构。本研究中,作者对38317个斑马鱼胚胎细胞进行测序,并开发一种新的基于传播的计算方法 URD 用于重构发育轨迹

斑马鱼胚胎细胞的单细胞转录组测序

利用 Drop-seq,对横跨斑马鱼早期发育过程中12个紧密相邻阶段的694个胚胎中的38371个细胞进行转录组测序。取样的时间点从高囊胚阶段(受精后3.3h,受精卵基因组转录开始,绝大部分细胞具有多能性)到六体节阶段(受精后12h,原肠胚形成后不久,大量细胞分化形成特定细胞类型)(下图左)。t-SNE 结果显示发育时间是数据中变异的一个主要来源,但在图中不能明显看出发育轨迹(下图右,颜色对应左中取样时间点的颜色)。此外,与不同类型细胞随着时间推移,在转录层面变得更具差异性的理解一致,来源于早期发育节点的细胞在 t-SNE 图中呈现连续性,而在晚期,分支之间分离度更大
whole_tsne

URD 重构复杂发育轨迹

以高时间分辨率获得大量单细胞转录组数据使得我们能够利用转录组的相似性来重构发育轨迹,从而帮助我们探索基因表达的动态变化以及分子特化的时间点。作者开发了 URD 来揭示发育轨迹。URD 对传播图(diffusion maps)(最初用于单细胞分化分析,在R包density中实现)进行了一些改进:引入新的方式将细胞按照拟时间进行排序;找出发育轨迹;发现抽象化发育过程的分叉树;以及对数据可视化
简单来说,URD 利用模拟传播的方式,通过离散随机漫步和图形搜索估算传播的连续过程:

  1. 首先,URD 根据细胞的基因表达谱构建转录组之间的k最近邻居图,图中的边代表转移可能性,表示随机漫步沿着各边移动的几率,在后续模拟中用作权重
  2. 用户确定发育过程的根(起始点)和尖(终止点),之后细胞被分配一个拟时间,反映了它们在发育过程中的相对排列,拟时间的计算是通过模拟传播确定每个细胞与根之间的距离(多次模拟中从根到达细胞所需传播转移的平均值)来确定的
  3. 然后,为确定每个尖与根之间的发育轨迹,从各个尖端起始,模拟具有偏好性的随机漫步——只向着具有相同或更早拟时间的细胞移动
  4. 之后,URD 将通过相同细胞的轨迹联合,构建出分叉树结构
  5. 最后,基于每个尖端衍生出的随机漫步访问到细胞的频率,通过力导引的分布进行可视化

重构的发育树概述斑马鱼胚胎形成过程中的分子特化过程

将 URD 用于斑马鱼胚胎发生 scRNA-seq 数据得到发育树,其中各分支反映了胚胎特化轨迹。为了确定最终那些的细胞群(树的尖端),对最终时间点的细胞进行聚类,