整合scRNA-seq和ATAC-seq數據分析人類發(fā)育過程中造血功能的調控

欄目:最新研究動態(tài) 發(fā)布時間:2021-05-24
劍橋大學血液學系Ana Cvejic教授團隊應用scRNA-seq和scATAC-seq技術對來自胚胎肝臟和骨髓的8,000多個免疫表型HSPCs進行綜合分析,探......

2021年3月,劍橋大學血液學系Ana Cvejic教授團隊應用scRNA-seq和scATAC-seq技術對來自胚胎肝臟和骨髓的8,000多個免疫表型HSPCs進行綜合分析,探索人類發(fā)育過程中造血功能的調節(jié)機制。該項工作以“Integrative single-cell RNA-seq and ATAC-seq analysis of human developmental hematopoiesis”為題發(fā)表在Cell Stem Cell上。

在胚胎發(fā)育過程中,造血干細胞(HSCs)需要快速分化為成熟的血細胞。我們目前對胎兒造血干細胞和祖細胞(HSPCs)的認識主要是通過小鼠和體外模型系統(tǒng)取得的。已有研究表明,胎兒造血過程包括發(fā)育過程中不同器官上罕見造血干細胞的分化、遷移和分化的幾個獨立波。在人類中,最終的造血功能開始于懷孕27天后,造血干細胞出現在造血集群的背主動脈內。這些明確的造血干細胞在妊娠后4周(pcw)首先在胎兒肝臟定植,并在那里大量擴張。在10.5 pcw時,造血部位再次轉移到骨腔(即骨髓[BM]),成人造血在此處永久建立。人們認為,第一批在骨髓中播種的造血干細胞在其增殖和分化特性發(fā)生戲劇性變化之前,會繼續(xù)快速增加數量,以適應高產量分化子代的需要。

歷史上,造血系統(tǒng)的分化過程被描述為一系列中間步驟,由細胞表面標記物(即分化簇[CD])定義。在這個模型中,造血干細胞通常表現為造血樹,造血干細胞產生了越來越多的譜系限制性細胞類型,最終導致成熟的血細胞。這種模式在過去的5年里發(fā)生了改變,一些研究報告了數千個單個造血細胞的轉錄組,這些細胞被細胞表面標記物隔離,在小鼠模型和成人中。這些報告表明,以前被認為是同質的祖先種群,實際上在轉錄水平上是非常異構的。

造血干細胞早期命運決定的機制在很大程度上尚不清楚。據推測,譜系特異性轉錄因子(TFs)在噪聲閾值以上的隨機表達可以鎖定一個細胞進入一個獨特的細胞命運。與此相一致的是,在多能造血細胞中觀察到與拮抗譜系相關的基因的共表達,包括關鍵的TFs,這表明在多能細胞室中存在一些細胞亞群,這些亞群允許細胞在譜系承諾之前的命運相反,這一現象被稱為啟動。最近,人類hspc的單細胞RNA測序(scRNA-seq)引入了一個不同的啟動概念。對成人骨髓和胎兒肝臟造血的研究已經確定了造血干細胞和多能祖細胞(MPPs)的亞群,這些亞群具有協(xié)調表達的標記基因,特異于不同的單胎分化程序,并沿著所有分化分支逐漸增加。有一些跡象表明,星狀細胞間室的譜系啟動可能不僅發(fā)生在轉錄水平,也發(fā)生在表觀遺傳水平。來自成人骨髓表型hspc的轉座酶可及染色質測序(scATAC-seq)的單細胞分析數據顯示,表型MPPs在染色質可及性方面存在差異。

技術路線:

 

 

一、人胎肝和骨髓造血室的單細胞轉錄組

 

 



為獲取胚胎發(fā)育期間造血細胞的全部譜系,研究者從17 – 22 PCW的胚胎肝臟、股骨和髖骨中對表型確定的血液群體進行單細胞分類,并對15個胚胎的單個細胞進行scRNA-seq檢測(圖1)?;诓町惐磉_分析和標準化表達顯著性排名前20的標記基因,標注了23個不同的群體,發(fā)現在肝臟或股骨中檢測不到任何T細胞或先天淋巴細胞(ILCs),單細胞分析顯示在所有免疫表型定義的干細胞和祖細胞群體中存在大量的轉錄異質性,其中一些表型祖細胞群體(如HSCs,MPPs,CMPs,GMPs,MEPs和CLPs)由10多個不同的轉錄表型定義群體組成,這進一步證明人類臍帶血的祖細胞室具有高度的異質性。此外,該研究分析表明當前使用的細胞表面標記物不能很好地預測人類胚胎造血祖細胞的轉錄狀態(tài)

使用SmartSeq2協(xié)議對15個胎兒的單個細胞進行scRNA-seq處理(圖1 a)。

基于差異表達(DE)分析和按標準化表達顯著性排序的前20個標記基因。紅細胞(表達HBG1、HBA1、GYPA和ALAS2)、mk(表達FLI1、ITGA2B和GP9)、單核細胞祖細胞和單核細胞(表達CD14、MPEG1和CD33)、CD4+單核細胞、肥大細胞(表達CD63、GATA2和HDC)、漿細胞樣樹突狀細胞(pDCs;表達IL3RA, IRF8, MPEG1和JCHAIN)和另一簇高循環(huán)pDCs(表達pDC和增殖標記物;例如,MKI67)和粒細胞1、2和3(表達AZU1、MPO和PRTN3)(圖1B)

單細胞分析顯示,在所有免疫表型定義的干細胞和祖細胞群體中存在顯著的轉錄異質性,一些表型祖細胞群體(如造血干細胞、MPPs、cmp、gmp、MEPs和CLPs)由超過10個不同的轉錄定義群體組成(圖1 c).

注釋了23個不同群體(圖1 d).


二、胎兒造血過程中分化軌跡的推斷




接下來,研究者使用力導向圖繪制算法推斷了人類胚胎發(fā)育期間造血細胞的分化軌跡。結果顯示HSCs/MPPs位于軌跡頂端,并且在HSCs/MPPs下游,研究者鑒定了三個高度增殖的寡能祖細胞群,即MEMPs(紅系細胞、MKs和肥大細胞);GPs(粒細胞);LMPs(淋巴樣細胞、單核細胞和樹突狀細胞)(圖2A和2B)。并使用Scanpy的paga_path函數顯示了沿三條分化途徑(MEMPs、GPs和LMPs)的譜系特異性基因動態(tài)表達(圖2C)。MEMPs將hsc / mpp與MKs、紅細胞和肥大細胞連接起來。與此一致的是,HSC/MPP向MEMPs轉化的差異調控基因包括MK/紅系/肥大細胞譜系特異性基因,如GATA1、ITGA2B、PLEK、KLF1、HDC和MS4A3(圖2C)。然后利用SCENIC通過分化軌跡識別出HSPCs和成熟血細胞中162個調節(jié)子,其中HLF和HOXA9是HSCs/MPPs中的主要調節(jié)子,且HSC/MPPs簇在轉錄上為高度未成熟的細胞群(圖2D)。鑒定了一個增殖的MEMPs- cycle群體,92%的MEMPs處于G2M/S期,而65%的MEMPs處于G2M/S期(圖2E)。此外,研究者對HSCs/MPPs- cycle和HSCs/MPPs進行DE分析,結果顯示HSCs/MPPs- cycle增加了糖酵解相關基因的表達,除了HSCs/MPPS-Cycle簇中存在轉錄啟動外,HSCs/MPPs和HSCs/MPPs-Cycle之間沒有其它轉錄差異。


三、沿著推斷分化軌跡的Motif可及性動態(tài)

 


 

由于技術限制,scRNA-seq難以檢測低豐度轉錄本(如轉錄因子TFs),而通過染色質的可及性可推斷出這些TFs的活性,因此整合scRNA-seq和scATAC-seq方法具有重要意義。研究者利用scATAC-seq檢測了人類胚胎Lin- CD34+ CD38-細胞的單細胞染色質可及性,分別對18、20和21PCW胚胎的肝臟和股骨中的4,001個細胞進行了測序,基于SNN算法,共得到7個不同的可明顯分離的集群 (Figure 3A)。scRNA-seq數據中檢測了所選標記基因的可及性,與干細胞相關的標記基因(如MLLT3、PROM1、FLI1和GATA2)的可及性較高,而與不同譜系相關的基因(如MPO、ALAS2、MPEG1和CD19)的可及性較低,這與分選細胞的未分化特性一致(圖3B)。生成的軌跡顯示出兩個分支,每個分支的染色質可及性和分化有明顯的趨勢(圖3D和3E)。我們觀察到簇1、簇2和簇4的可達性最高,并逐漸向兩個分枝的頂端遞減。接下來,研究者使用chromVAR計算不同簇中可及性TF序列基序,沿著軌跡推斷確定的兩個分支,可觀察到譜系特異性造血TF基序的可及性的動態(tài)變化(如GATA1、TAL1、KLF1、HTF4、ID4、IRF8和TFE2),其中GATA1是紅系細胞、巨核細胞和肥大細胞分化的重要調節(jié)因子,且僅在scRNA-seq數據集中的MEMP簇中表達;TAL1有兩種不同的結合基序,在胎兒造血過程中,這兩種基序在不同的造血祖細胞中均具有活性;CEBPD和IRF8的活性對髓系和樹突狀細胞的分化至關重要;ID4和HTF4參與淋巴系的建立;這與scRNA-seq數據中的觀察結果一致(圖3F 3H)。

 

四、scRNA-seq和scATAC-seq數據整合




目前尚無人類胚胎HSPCs的染色質可及性圖譜,研究者基于基因體可及性繪制細胞圖譜來整合scRNA-seq和scATAC-seq數據。首先使用6種豐富的細胞類型對scRNA-seq實驗中篩選出的CD34+ CD38- 細胞進行分類,結果顯示scATAC-seq數據集中指定細胞類型的頻率與scRNA-seq數據中的頻率高度一致,這表明染色質可及性和轉錄組具有相關性。然而,不同類型的細胞在整個軌跡上有相當大的混合,如HSCs/MPPs-Cycle廣泛分布在七個集群中,這表明在HSCs/MPP群體中存在廣泛的染色質啟動,從而導致了異質性。之后研究者比較了7個集群中HSCs /MPPs中選定的譜系特異性TF基序的可及性,結果顯示在轉錄同源的HSCs/MPPs集群中,一些先于基因表達的TFs的活性存在顯著差異。 最后,研究者進一步探索分化過程中染色質可及性和基因表達之間的“時滯”,結果顯示在HSCs/MPS中,GATA1-調節(jié)子靶基因的啟動子在任何明顯基因表達之前均是開放的,這證實HSCs/MPP中染色質的可及性早于轉錄變化。


五、gata1調控靶基因的染色質可及性及表達動態(tài)




檢測了pySCENIC鑒定的最頂層gata1調控靶基因的scRNA-seq和scATAC-seq數據(根據AUCell評分排序)(圖5)。

我們觀察了兩個基因啟動子(距轉錄起始位點3kb [TSS])和遠端調控區(qū)域(距TSS 50 kb)的可及性,以及沿MEMP分化軌跡所選靶基因的表達水平(圖5A)。我們觀察到,在造血干細胞/ mpp中,gata1調控靶基因的啟動子在任何明顯的基因表達之前通常是開放的(圖5A)。因此,與我們之前的觀察一致,造血干細胞/ mpp的染色質可及性發(fā)生在僅存在于分化程度更高的細胞中的轉錄變化之前。有趣的是,與第1類(hsc /MPPs)相比,第6類(MEMPs)中GATA1靶基因的啟動子可及性總體較低(圖5B、5D和5E),與拮抗基因(即針對不同譜系的基因)的啟動子共可及性較低相吻合(圖5F)。相比之下,簇6中遠端調控元件/增強子的可及性高于簇1(圖5C)。這可能表明gata調控基因可能在啟動子上啟動,而增強子則提供細胞類型特異性的表達。

 

六、改進分選策略以分離胚胎HSCs/MPPs


研究者基于細胞表面標記設計了一種針對HSCs / MPP的新的熒光激活細胞分選策略(簡稱CD-REF),使用CD-REF分選板對股骨BM細胞進行分選,結果顯示標記為HSCs / MPP和HSCs / MPPs-Cycle簇的CD-REF細胞約占88%。為了評估CD-REF細胞譜系輸出的分化潛力和穩(wěn)健性,研究人員在小鼠MS5飼養(yǎng)層或更具生理相關性的人類胎兒間充質干細胞(fMSCs)上對三個胎兒的單個細胞進行了分選,結果顯示MS5和fMSCs上分別存在著四系、三系、雙系、單系和未分化的譜系集落。接下來,又對單個CD-REF和免疫表型HSCs進行了分類,結果顯示CD-REF在胎兒肝臟和骨髓中富集了多譜系輸出的細胞群,且CD-REF細胞具有與表型HSCs相當的多潛能性和譜系輸出能力,這與前述分化軌跡探究一致,再次驗證CD-REF代表了高富集的HSC/MPPs群體。


七、股骨和肝臟細胞在不同細胞類型之間的統(tǒng)計學差異


HSC / MPP簇中的細胞來源于肝臟,股骨和髖部,這為評估起源于胚胎肝臟或骨髓的HSC/MPP群體中潛在的定性和定量差異提供了機會。研究者首先對處于不同細胞周期狀態(tài)的肝臟和股骨細胞的數量進行了Fisher精確檢驗。結果顯示,在股骨和肝臟中,絕大多數CD-REF細胞處于G0/G1期,而肝臟中處于S-G2-M期的細胞數量幾乎是股骨的兩倍。KS和MWW檢驗顯示,與肝臟相比,股骨中HSCs/MPPS中基因表達數量也比較少,但股骨中HSCs/MPPs顯著上調了與核小體組裝、染色質組裝和DNA組裝有關的基因,而肝臟中HSC/MPPs顯著上調了與肌動蛋細胞骨架重塑、細胞粘附和遷移有關的基因。