在细胞的分化发育历程中,干细胞和祖细胞会阅历一系列的分化运说念抉择,以最终卵白抒发呈现出的细胞功能景象看成临了分化抉择。武断祖细胞与其子代后裔磋商的金尺度是谱系跟踪,同期近来的单细胞 RNA 测序期间不错描写策动样本的基因抒发景象图谱。但不管是细胞景象图谱,抑或是谱系克隆跟踪,齐无法为咱们提供细胞分化动态的完整信息。单细胞测序(scSeq)可用于精准武断细胞景象,但不可进展祖细胞景象与子代细胞分化运说念间的磋商;scSeq 分析成果也不可提供祖细胞分化为某一特定子代细胞的潜在景象信息,以及发育为统一子代细胞的多种分化旅途信息;此外,scSeq 数据分析的万般性,使得相似的数据集也可构建出不同的细胞景象轨迹。因此,整合细胞基因抒发景象与细胞克隆谱系发育动态间的磋商显得尤为紧迫。
sm 调教sm 调教
在成东说念主体内造血干细胞(HSC)和祖细胞(progenitor)驻留在骨髓中保管稳态的造血功能,数十年的细胞培养和移植盘问已构建出看似完整的造血祖细胞群的分化层级磋商,但近期的 scSeq 成果标明 HSC 在细胞景象以及分化运说念方进取具有异质性。为探究这背后的内容原因,咱们需要跟踪单细胞克隆的分化动态和 HSPC 的连气儿抒发景象图谱。来自 Harvard 医学院和 Boston 儿童病院的盘问者开辟了一种不错拿获细胞景象的单细胞全转录组盘问期间,通过盘问不同期间点的细胞克鸿运说念,在数千个细胞中找寻单细胞景象与分化运说念的内在磋商。
细胞克隆景象与分化运说念检测同步化
为同期拿获细胞的景象图谱与分化运说念信息,作家遐想了一套特殊的遗传编码来记号异质性祖细胞群,以便在分化历程中随时不错反复进行 scSeq。在经典的 lentiviral 病毒记号基础上,盘问者更正了 DNA 编码(barcode)的记号形势,通过将 EF1α启动子流畅 eGFP 卵白序列,随后在 eGFP 序列 3′ UTR 端插入 28bp 偶而片断,构建名为 Lineage and RNA recovery (LARRY) 的 DNA barcode。此编码文库库容可达~0.5 × 10^6,足以对 5000 cells 进行记号且 barcode 重复率小于 1%,再蛊卦 scSeq 期间已矣 LARRY 记号的抒发检测。
图 1:细胞景象图谱与分化运说念图谱 coupling 走漏(A);LARRY barcode 结构走漏(B)
这一套 barcode 决策不错提供三类重要信息(图 1):分化开动阶段姊妹细胞的抒发景象,开动阶段姊妹细胞与分化阶段子代细胞间的抒发动态,以及不同分化主见临了细胞间的克隆磋商。若是初代姊妹细胞(type 1)间在转录组学上阐扬相似,那么子代细胞的分化相近克隆(type 2)不错用来揭示单细胞分化历程中的基因抒发动态。上述决策可在不需要分离或记号特定祖细胞群的基础上,呈现细胞群的连气儿分化抒发的运说念图谱。
图 2:In vitro 组 HSPC 谱系跟踪成果
为厘清 HSPC 的分化运说念抉择,盘问者使用 LARRY 记号款式,同期进行了体外培养(in vitro)和体内移植(cells transplanted in vivo)两种决策的盘问。关于 in vitro 实验,作家使用 Sony SH800 自动化分选仪以极高的活性和纯度将 Lin-Sca-Kit+和 Lin-Sca1 +Kit+两类祖细胞分选出来,偶而参加体外培养来探究多谱系分化动态。在转染 LARRY barcode 后细胞会阅历两天的病毒整合和扩增,简略聚发生三次增殖行动。在 day 2 取 50% 细胞进行 scSeq 记载细胞开动景象(early state),剩余细胞经过扩增后分别于 day 4(30% cells)和 day 6(remaining cells)再分别以 scSeq 记载细胞末期景象(late state)。In vivo 组则采用 Lin-Sca(hi)Kit+祖细胞,转染 LARRY barcode 后整合病毒抒发和扩增。在 day 2 取 40% 细胞进行 scSeq 记载 early state,剩余细胞移植到 10 只放射小鼠体内,经过一至两周轮回扩增后再网罗样本进行 scSeq 记载细胞 late state。
图 3:In vivo 组 HSPC 谱系跟踪成果
在两套实验决策中,盘问者分别网罗到了 130,887(in vitro)和 182,173(in vivo)scSeq 转录组信息,共统计到 5864 clones 和 7751 clones,其中约有 38% 和 63% 的细胞属于统一种 clone,而在通盘分化的 early state 和 late state 期间点中存在连气儿动态变化的 clones 各自有 1816 和 817。
通过 SPRING plots 将上述单细胞转录组数据可视化分析,in vitro 组 progenitor 呈现出从多能祖细胞(multipotent progenitors, MPPs)到九类熟识细胞的连气儿分化景象图谱(图 2E 和图 3J):erythrocytes (Er), megakaryocytes (Mk), basophils (Ba), mast cells (Ma), eosinophils (Eos), neutrophils (Neu), monocytes (Mo), dendritic cells (plasmocytoid pDC; Ccr7 + migratory migDC) 和 lymphoid precursors (Ly)。在图示的细胞景象图谱中,细胞分化轨迹阐扬出了显耀的连气儿分化行动,包括单谱系分化、多谱系分化和祖细胞的自我更新(图 2 G)。In vivo 组 progenitor 也阐扬出相似的分化行动,从 MPPs 到多种景象的 neutrophil 熟识,以及 DCs, Mo, Er, B, T 和 Ba cells 群体的熟识。通过这两套决策,课题组得胜地已矣了单细胞景象图谱和克隆谱系分化运说念的同期表征。
克隆分化动态武断早期细胞转录运说念鸿沟
有了 LARRY 记号款式的匡助,通过分析每个克隆在多个期间点上的 scSeq 数据即可已矣单个细胞的谱系分化动态表征。但需要细心的是,这种款式的准确性很是依赖于开动期间点姊妹细胞间的相似性。如图 4 所示,在 day 2 开动姊妹细胞景象中,约 70% 姊妹细胞属于交流或临近簇群。尽管存在约 10% 的偏离姊妹细胞群, 使得细胞分化运说念鸿沟的分辨率有所裁汰,但咱们仍可通过克隆轨迹分析,得胜推断出单细胞分化轨迹。
图 4:Early state 细胞转录抒发景象与分化运说念鸿沟分析
在 in vitro 组数据中sm 调教,盘问者记载了通盘 day 2 期间点的细胞景象和运说念图谱。单一谱系克隆的 SPRING 图涌现了雅致的运说念抉择,在祖细胞分化后的不同熟识细胞的重迭处,可见明白的 bi-potent 克隆关于运说念抉择的鸿沟位置,标明了祖细胞群并未罗致龙套的分化形势,拔帜树帜的是结构性的连气儿分化轨迹。此外 bi-potent 克隆可酿成额外的运说念分支,讲解细胞分化设施可在某些情况下孤独于运说念抉择设施除外自主发生。
图 5:In vitro 组以及 in vivo 组祖细胞分化谱系跟踪
通过基因抒发的异质性分析,盘问者确信了上述连气儿分化群体的亚群踱步和可能的临了分化运说念。处于 day 2 的早期多能祖细胞 CD34 +主要阐扬为干细胞 marker(Procr)抒发,两侧分别为抒发 Gata2 的红系细胞群和抒发 Flt3 的淋巴样开动细胞(图 5E)。通过克隆叠加,不错看到各功能特异性谱系亚群与 CD34 +祖细胞的分化图谱严格一致,Mk,Ba,Ma 和 Eos 亚群均起原于 Gata2 +一侧;每个亚群的分化基因抒发图谱也阐发了造血历程中通盘已知的分化 marker 以及潜在的未知 marker,如髓系白血病 marker(Ikzf2)高抒发于 Ma 和 Eos 亚群,而有数于 Mk 和 Ba 亚群。In vivo 组的盘问成果相似撑执上述论断,尽管临了景象的亚群细胞相对较少,但分化运说念均可与相应的罗致 marker 逐一双应。
追想来说,功能发育谱系与祖细胞的分化连气儿景象息息关联,并伴跟着特定基因的抒发变化而相应地更正如转录因子在内的功能景象抒发。
scSeq 抒发图谱能否有用想到细胞分化运说念?
影响细胞分化运说念的身分复杂多变,包括细胞与外皮环境的战役、染色质景象、关联基因抒发和偶而的分子作用等。scSeq 期间仅可提供有限的细胞景象抒发信息,咱们无法以此构建完划一备的景象图谱,那么随之而来的问题是 scSeq 数据究竟不错在多猛进度上想到细胞分化运说念呢?
为评估这一可能性,作家参考了两种机器学习算法(logistic regression & neural network)。以现存的 scSeq 数据为基础,通过对偶而基因簇、转录因子、分化驱动基因和高度动态变化的基因进行演算,成果发现转录因子组的想到成果仅比偶而基因簇组高~10%,而分化驱动基因组则可执续性地阐扬出相反性(图 6 A/B),讲解 HSP 群体基因抒发图谱的想到内容可有用心事数百个分化驱动基因,以及部分转录因子。
图 6:scSeq 数据想到细胞分化运说念
细胞分化运说念想到的准确性会受多种偶而身分影响,这其中也包括了 scSeq 数据未能拿获的某些信息。若是这种封闭变量的确存在,那么 scSeq 数据分析归类细胞亚群功能的准确性将大打扣头。通过 early state 和 late state 的细胞运说念想到,课题组尝测考据上述变量是否信得过存在。若是不存在,相邻姊妹细胞间的共同景象信息将跟着分化而渐渐消除;若是存在,那么影响细胞分化的封闭变量将会使姊妹细胞间的突变信息渐渐增加。
为比较哪个阶段的景象信息可更准确地想到分化运说念,盘问者对 early state 姊妹细胞和 late state 细胞抒发景象进行了机器学习算法分析。演算成果发现,early state 信息不错为细胞分化运说念的想到提供 60% 和 52% 的准确度(图 6 E/H),而 late state 信息不错想到提供 76% (in vitro) 和 70% (in vivo) 的准确度。因此 late state 更能响应姊妹细胞间分化运说念的想到准确性,讲解在细胞景象图谱中仍然存在 scSeq 期间无法拿获的封闭变量,这些变量不错导致分化运说念的不同抉择,即 scSeq 期间仍不及以准确描写功能差别明确的祖细胞景象图谱。
图 7:Monocytes 分化旅途的谱系分析
克隆谱系分析,不错提供更多的 scSeq 数据无法揭示的分化旅途信息。在前边的 dataset 中,咱们不错看到 monocytes 的分化连气儿谱系:从 neutrophil-like type 到 DC-like type(图 7 A/C)。但在克隆关联性上,monocytes 与 neutrophils 以及 DCs 均莫得显耀性的精致磋商,故而 monocytes 在分化表型轨迹上与其他谱系的克隆间具有明白的专有性。作家分别检测了 day 2 和 day 6 姊妹细胞的 DC/neutrophil-like 亚群,基因抒发图谱涌现, neutrophil-like 以及 DC-like 亚群细胞在基因抒发上阐扬出明白不同,这种迥异的分化轨迹可能对应着 MDP 和 GMP 亚群的分化旅途。
造血作用中祖细胞分化运说念的想到准则
通过前述的多数实验数据分析,作家整理出细胞分化轨迹的三类想到准则:
1. scSeq 数据模子不及以 100% 想到分化运说念
盘问者使用了三种想到模子:Population Balance Analysis (PBA), WaddingtonOT (WOT) 和 FateID,以 day 2 景象为早先,依据转录组数据想到 day 6 克隆景象(图 8)。三种模子均可与践诺分化成果保执较好的一致性,但 CD34 +克隆轨迹分析涌现 monocyte 与 neutrophil 存在分化交叉点,而这是预遐想法未能有用推算的信息。想到模子使用分化调控基因的抒发图谱进行演算,但 scSeq 数据有时可能无法一说念拿获并呈现某些潜在的分化调控基因。因此在短少谱系信息的情况下,预遐想法可能会得出分化抉择演算乌有的成果。
图 8:细胞分化运说念图谱
2. Pseudotime 分析拿获细胞分化轨迹
通例中的 scSeq 数据分析中,一个首要策动是通过界说 pseudotime 期间流将分化动态中的基因抒发按序摆设开来,以此构建分化轨迹。到咫尺收尾,咱们仍旧还不了了单细胞动态分化中的具体速度,以特等是否不错逆转分化动态。
丁香成人网图 9:Pseudotime 分析描写细胞分化轨迹
在 neutrophil 亚群分化历程中,盘问者测试了 pseudotime 分析款式究竟不错多猛进度地准确态状细胞亚群的分化动态轨迹。通过对 MPPs,GMPs,promyelocytes (PMy) 和 myelocytes (My) 多个样本亚群连气儿两天的克隆分析,成果发当今 pseudotime 期间流上阐扬出恒定上前的分化速度(图 9),举例 MPP 细胞分化至 myelocyte 需要 10 days,这与以往的盘问成果一致;同期对姊妹细胞不同期间点的分化 pseudotime 流冉冉分析,发现 day 2 与 day 6 节点细胞的扩增分化轨迹也保执了一致的措施。因此毫无疑问地, pseudotime 分析款式可用于描写细胞发育的分化运说念图谱。
3. 细胞景象图谱与分化谱系层级的协统一致
当细胞在分化轨迹中面对多主见罗致时,基于细胞转录图谱与克隆谱系的高度一致性,东说念主们罗致使用 scSeq 期间来想到细胞分化谱系。但如前所述,上述想到模子并未探讨到底下两点身分:1)非同种分化克隆可能存在相似的临了细胞景象;2)即便来自于相似的祖细胞系,由于非对称踱步,分化熟识的细胞群也可能保执不同临了景象。
图 10:细胞景象图谱与分化运说念图谱的连合演算
为使用谱系克隆和转录景象图谱构建信得过准确的分化运说念层级,盘问者们系统比较了每对分化姊妹细胞的景象相似性和和克隆分化数量(图 10)。在 in vitro 组中当分别用景象图谱和克隆谱系构建分化旅途后,成果涌现两者的分化旅途基本一致,仅在 mast cells 的分化节点上有所区别;而在 in vivo 组中,景象图谱与克隆谱系间的协统一致性明白裁汰,这可能与 in vivo 组复杂的分化环境以及更长的分化期间有密切磋商。
Weinreb 等东说念主开辟的 LARRY barcoding 文库使得盘问者们不错已矣精准的谱系跟踪。与基于 CRISPR 裁剪的谱系跟踪技能比较, LARRY 记号技能的不同点在于其不再仅将细胞的景象图谱看成临了变量,而是结合期间流已矣拟时候析。比较于 CRISPR 的复杂操作,LARRY 更为简便易于已矣,不需要建筑谱系发育树;具有更高的单细胞 barcode 心事率;同期也不需要对细胞进行过多裁剪。但 LARRY 记号技能也有其残障,就咫尺的期间而言 LARRY 无法描写一个细胞周期内的细胞景象图谱,但 LARRY 仍不错无偏差的形势已矣细胞的早期基因抒发图谱与分化运说念抉择间的深度磋商。
通过 LARRY 记号技能,东说念主们不错在 scSeq 数据的基础上,已矣对不同组织样本的细胞景象图谱和分化运说念图谱的描写,并结合两者来匡助盘问者们真切判辨干细胞的发育分化行动机制。
Reference:
Weinreb et al., Science 10.1126 /science.aaw3381 (2020)