近日,騰訊 AI Lab 三項研究分別入選國際頂級學術期刊 Nature Methods 和 Nature Communications,再次展示了在生命科學前沿領域上國際領先的技術實力。
這三項研究成果都屬于生物細胞研究中的空間組學技術,對于推動精準醫(yī)療、細胞圖譜繪制、人類生命健康等領域的研究具有重要意義。
細胞是生命的基本單位,但當前人類對細胞的認知有限。空間組學技術的出現(xiàn)和發(fā)展,讓我們可以獲取細胞在時間和空間維度上的基因表達模式以及細胞之間交互的情況,從高精度的分子層面去理解器官和組織的功能,這對于理解細胞生物學,發(fā)育生物學,神經(jīng)生物學,腫瘤生物學等的關鍵信息至關重要,可以填補組織和器官水平上位置與功能關系研究的空白。
空間組學技術是高通量轉錄組測序、單細胞測序等技術的升級,它通過在細胞分析中,增加「空間」這一重要的信息維度,使得研究員可以從更全局、立體、精細地認識生物系統(tǒng)的運行規(guī)律。
近年來,通過深度學習等人工智能技術的引入,空間組學技術領域不斷迎來新的突破,本次騰訊 AI lab 的三項成果,分別從細胞類型注釋、微環(huán)境建模以及數(shù)據(jù)庫三個方面重點突破,并在準確率、數(shù)據(jù)規(guī)模以及方法創(chuàng)新性上均展示了超出業(yè)界標準的水平,推動國際學術社區(qū)和相關研究的發(fā)展。
它們分別是:
-
一種基于遷移學習和空間嵌入的空間轉錄組細胞類型注釋方法?Spatial-ID
-
一種利用空間組學數(shù)據(jù)進行微環(huán)境建模的通用方法?SOTIP?
-
一個目前業(yè)界最大規(guī)模(超過5000萬個細胞)、最多種類(26種)的空間組學數(shù)據(jù)庫
在空間組學相關技術上,騰訊 AI Lab 的核心攻堅方向和優(yōu)勢在于 AI 算法研究,長期以來,騰訊 AI Lab 與業(yè)內(nèi)知名研究所和醫(yī)院廣泛合作,實現(xiàn)在生命科學的研究和臨床場景中落地,具體應用包括建立細胞圖譜,尤其是靈長類大腦圖譜,促進腦科學的研究。
臨床方面,騰訊 AI Lab 將通過空間組學研究腫瘤的微環(huán)境和發(fā)展軌跡,助力推進有針對性的精準醫(yī)療。
騰訊在醫(yī)療及生命科學領域已有多項探索。2022年, 騰訊 AI Lab 聯(lián)合北京協(xié)和醫(yī)院,共同發(fā)布了便攜式智能化手術導航系統(tǒng),臨床初步應用取得成功。此外,實驗室創(chuàng)新性地提出關于單細胞注釋的 scBERT 算法,成果發(fā)表于國際頂級學術期刊《Nature Machine Intelligence》雜志。
Nature Methods 是 Nature(《自然》)系列期刊中的關注前沿科學研究的期刊,每年評選生命科學領域的年度方法,2022 年期刊影響因子 47.99,在生物研究方法領域排名第一。Nature Communications 是 Nature(《自然》)系列期刊中的綜合類子刊,專門收錄來自于自然科學各個領域的高質(zhì)量研究成果,2022 年期刊影響因子 17.69,在綜合類期刊中位列第三。
三項研究詳解
研究1:一種基于遷移學習和空間嵌入的空間轉錄組細胞類型注釋方法 Spatial-ID
英文標題:Spatial-ID: a cell typing method for spatially resolved transcriptomics via transfer learning and spatial embedding.
論文鏈接:https://www.nature.com/articles/s41467-022-35288-0)
該研究利用了單細胞轉錄組中細胞類型的細胞表達譜信息作為參考知識,并采用圖神經(jīng)網(wǎng)絡的算法描繪空間轉錄組中細胞的空間位置關系,提供了一種快速的空間轉錄組細胞類型注釋方法。
圖1:Spatial-ID 算法流程
遷移學習可從已有的單細胞轉錄組數(shù)據(jù)集遷移單細胞表達譜知識??臻g信息嵌入則利用細胞在空間背景下與相鄰細胞之間的可能存在的交互關系或共表達模式,提升細胞類型識別的準確性。
從結果上看,在四個不同的空間轉錄組公開數(shù)據(jù)集(兩個鼠腦數(shù)據(jù)集,一個鼠腦生殖細胞數(shù)據(jù)集,一個人類非小細胞腫瘤數(shù)據(jù)集)上開展基準測試,與現(xiàn)有 8 種 SOTA 方法(Seurat, SingleR, Scmap, Cell-ID, ScNym, SciBet, Tangram, Cell2location)進行性能對比。
Spatial-ID 在 4 個數(shù)據(jù)集上分別取得了 92.75%,87.74%,60.45%和 69.76% 的準確性,均顯著地優(yōu)于 SOTA 方法;尤其是在小鼠下丘腦視前區(qū)的三維空間轉錄組數(shù)據(jù)集上,與最佳的 SOTA 方法對比,Spatial-ID 的細胞類型注釋平均準確性提升了約 6.5%。
圖2:小鼠下丘腦視前區(qū)的三維空間轉錄組數(shù)據(jù)集基準測試結果
另外,Spatial-ID 還提供了新細胞類別發(fā)現(xiàn)的流程,發(fā)現(xiàn)參考數(shù)據(jù)集中沒有的細胞類型。
據(jù)論文作者介紹,基于空間轉錄組的細胞類型注釋對單個細胞中基因的特異性表達和細胞所處空間微環(huán)境展開研究,系統(tǒng)性地分類組織中的細胞類型,并統(tǒng)一描繪每一種細胞類型的分子特征以及它們在組織內(nèi)的位置,這將改變我們對生物學和疾病的理解,并可能帶來疾病診斷和治療方式的重大突破。
未來,Spatial-ID 空間轉錄組細胞注釋算法,可以為大規(guī)??臻g轉錄組測序數(shù)據(jù)進行細胞類型注釋,致力于構建大規(guī)模的組織細胞圖譜,例如全鼠腦/猴腦的空間轉錄組細胞圖譜。
研究2:一種利用空間組學數(shù)據(jù)進行微環(huán)境建模的通用方法 SOTIP
英文標題:SOTIP is a versatile method for microenvironment modeling with spatial omics data
論文鏈接:https://www.nature.com/articles/s41467-022-34867-5
該研究利用人工智能領域的最優(yōu)傳輸理論,同時結合細胞在物理空間和狀態(tài)空間的連續(xù)性,對微環(huán)境進行建模。
其亮點在于,通過構建微環(huán)境之間的相互關系網(wǎng)絡,將細胞分子表達譜的低維流形與空間局部拓撲特征聯(lián)系起來,達到多個重要計算任務的同時分析,包括微環(huán)境異質(zhì)性定量、空間域識別及差異微環(huán)境分析。
SOTIP 在多種空間轉錄組、蛋白組和代謝組數(shù)據(jù)的測試中展現(xiàn)出較好的準確性、穩(wěn)定性和魯棒性。
在空間異質(zhì)性定量方面,SOTIP 在亞細胞層面上精準勾畫了腫瘤細胞核膜和內(nèi)質(zhì)網(wǎng)膜的輪廓 (AUC=0.85);在組織層面上識別了腫瘤和正常肌肉組織的邊界(Spearman系數(shù)=0.847)。
在空間域識別方面,SOTIP 在多種空間蛋白組和轉錄組數(shù)據(jù)中呈現(xiàn)出較高的準確性,精確識別不同腦區(qū)及腫瘤結構,在人類腦區(qū)識別中達到了 0.58 的 ARI,效果優(yōu)于 BayesSpace、SpaGCN、STAGATE 等經(jīng)典算法,并能適用于三維空間數(shù)據(jù)。
在差異微環(huán)境分析方面,SOTIP 利用識別出的微環(huán)境發(fā)現(xiàn)了三陰性乳腺癌的兩種亞型,在 34 個病人隊列中有著顯著不同的預后(顯著性p value=9.2*10^-6)。
SOTIP 的兩大應用場景是腦科學研究和腫瘤。
腦科學研究中的一大挑戰(zhàn)是研究不同神經(jīng)細胞類型之間、腦功能區(qū)之間、及神經(jīng)細胞與功能區(qū)之間的相互作用關系。SOTIP 可以無需任何人工干預地、準確識別大腦中不同功能性空間域,為大規(guī)模腦圖譜的構建建立基礎。
腫瘤最重要的細胞類型是免疫細胞和腫瘤細胞,它們之間的空間臨近關系和相互作用構筑了復雜的腫瘤微環(huán)境。在臨床診斷方面,許多疾病的分型無法通過免疫細胞和腫瘤細胞的各亞類的數(shù)量比例完成,SOTIP 前景是可以從微環(huán)境層面而不單單是細胞層面,識別不同腫瘤亞類的標志性微環(huán)境,從而對病人進行針對性治療。
研究3:目前業(yè)界最大規(guī)模(超過5000萬個細胞)、最多種類(26種)的空間組學數(shù)據(jù)庫
英文標題:SODB facilitates comprehensive exploration of spatial omics data
論文鏈接:https://www.nature.com/articles/s41592-023-01773-7
對于生物學家來說,新的生物學和病理學發(fā)現(xiàn)理應用不同的技術和分子組學來驗證,減少科學發(fā)現(xiàn)中的假陽性。將各種空間組學數(shù)據(jù)集中在一起并進行邏輯管理,使研究員可以根據(jù)需要快速搜索、定位和獲取多模態(tài)數(shù)據(jù),從而充分利用已發(fā)布的數(shù)據(jù),避免一些不必要的生物實驗。
從生物信息學家的角度來看,SODB 可以支持許多計算方法的 benchmark數(shù)據(jù)需求,讓方法開發(fā)人員只需專注于計算模型本身。?
該數(shù)據(jù)庫提供了目前業(yè)界最大規(guī)模(超過 5000 萬個細胞)、最多種類(26 種空間組學技術)的空間組學數(shù)據(jù),所有數(shù)據(jù)均由標準流程處理為 Anndata 形式(空間組學業(yè)界標準格式)。并提供了多種數(shù)據(jù)分析和新型可視化模塊,快速地對整個組織進行可視化并識別組織區(qū)域。
此外,還提供了配套 Python 工具包 pysodb,僅用一行代碼可以方便的讀取數(shù)據(jù),時間效率比傳統(tǒng)方式提升 160 倍(以 Slide-seq 數(shù)據(jù)為例,傳統(tǒng)方法讀取需要 19.04 分鐘,pysodb 僅需 7.16 秒)。
目前,該數(shù)據(jù)庫的數(shù)據(jù)開放給所有人:
數(shù)據(jù)集:https://gene.ai.tencent.com/SpatialOmics/
Python包:https://github.com/TencentAILabHealthcare/pysodb
參考鏈接:
1. Shen, R., Liu, L., Wu, Z. et al. Spatial-ID: a cell typing method for spatially resolved transcriptomics via transfer learning and spatial embedding. Nat Commun 13, 7640 (2022). https://doi.org/10.1038/s41467-022-35288-0
2. Yuan, Z., Li, Y., Shi, M. et al. SOTIP is a versatile method for microenvironment modeling with spatial omics data. Nat Commun 13, 7330 (2022). https://doi.org/10.1038/s41467-022-34867-5文章來源:http://www.zghlxwxcb.cn/news/detail-494132.html
3. Yuan, Z., Pan, W., Zhao, X., et al. SODB facilitates comprehensive exploration of spatial omics data. Nat Methods (2023). https://doi.org/10.1038/s41592-023-01773-7文章來源地址http://www.zghlxwxcb.cn/news/detail-494132.html
到了這里,關于精準醫(yī)療、空間組學、細胞圖譜,騰訊AI Lab用深度學習助力生命科學研究的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網(wǎng)!