隨著單細胞 RNA 測序技術 (scRNA-seq) 被廣泛應用于回答發(fā)育生物學、神經(jīng)科學、腫瘤學和免疫學中的許多基本問題。scRNA-seq對人類癌癥的研究不斷增多,各種癌癥中的細胞異質性、免疫浸潤和發(fā)病機制已陸續(xù)被揭示。scRNA-seq 成為研究腫瘤微環(huán)境、異質性、發(fā)病機制、轉移和侵襲以及治療和診斷多種腫瘤不可或缺的手段。在過去十年中,大規(guī)模癌癥 scRNA-seq 數(shù)據(jù)集呈指數(shù)級增長,迫切需要整合和處理各種癌癥類型的腫瘤微環(huán)境的基本研究。當前的腫瘤單細胞測序數(shù)據(jù)庫的整合、準確的細胞類型識別和全面的在線分析平臺在某種程度上仍然存在不足,給人類癌癥研究留下了巨大的挑戰(zhàn)。
最近中國科學院團隊構建了一個腫瘤單細胞測序數(shù)據(jù)庫:CancerSCEM(https ://ngdc.cncb.ac.cn/cancerscem),該數(shù)據(jù)庫相關文章刊登在Nucleic Acids Research期刊(IF=16.971),題名為CancerSCEM: a database of single-cell expression map across various human cancers。該數(shù)據(jù)庫收集了公共 scRNA-seq 數(shù)據(jù)集,涉及來自 20 種人類癌癥的 208 個樣本的 638 341 個高質量單細胞。使用內部管道進行 TME 分析和功能基因注釋的多尺度數(shù)據(jù)分析,并在 CancerSCEM 中配備了一個全面的在線分析平臺。
以單細胞分辨率處理了 208 個癌癥樣本的多尺度數(shù)據(jù)分析,用戶可以瀏覽、搜索、在線分析和下載所有感興趣的元數(shù)據(jù)和分析結果。Project Browse頁面上的概覽和交互式表格展示了所有收集的癌癥 scRNA-seq 項目,信息范圍從新分配的唯一項目 ID、癌癥類型、樣本 ID、樣本詳細信息、細胞計數(shù)到。Sample Details和Analysis列還提供了指向腫瘤樣本詳細信息的超鏈接和每個數(shù)據(jù)集的綜合分析結果。
為了更好地訪問感興趣的數(shù)據(jù)集或基因,CancerSCEM 提供了幾種查詢方法:(i)快速搜索框和關鍵字,都可以通過指定癌癥類型、基因或數(shù)據(jù)協(xié)議進行實時查詢;(ii) 搜索頁面上的高級搜索模塊:在項目方面,用戶可以指定項目/樣本ID或登錄號,或選擇特定的癌癥類型; 在基因方面,通過搜索基因符號或基因 ID,用戶可以快速查看單細胞和批量 RNA水平的基因摘要和表達分布。
基因分析模塊。它包含四個功能: (i) 樣本中的基因表達 (GE)——特定癌癥單細胞樣本進行全表達譜分析;(ii) 亞型中的基因表達——樣本中不同細胞類型或亞型的基因表達;(iii) GE相關性——特定樣本中任意兩個基因之間的 pearson 相關性計算;(iv) GE比較——不同 scRNA-seq 或 TCGA bulk RNA-seq 數(shù)據(jù)集的基因表達比較。