艾倫人類腦圖譜(Allen Human Brain Atlas)
- 艾倫人類腦圖譜是一個(gè)由艾倫腦科學(xué)研究所(Allen Institute for Brain Science)開發(fā)的在線基因表達(dá)圖譜數(shù)據(jù)庫(kù),旨在提供人類大腦各個(gè)區(qū)域的細(xì)胞類型和基因表達(dá)信息。
- 這個(gè)數(shù)據(jù)庫(kù)包含了人類全基因組微陣列數(shù)據(jù)集、RNA測(cè)序數(shù)據(jù)集等,并使用標(biāo)準(zhǔn)化的數(shù)據(jù)處理流程和軟件工具進(jìn)行分析和可視化。
- 該數(shù)據(jù)庫(kù)對(duì)于研究人類大腦結(jié)構(gòu)和功能以及神經(jīng)系統(tǒng)疾病等方面都有很重要的作用。
艾倫人類腦圖譜在影像學(xué)中的應(yīng)用
目前國(guó)內(nèi)外的科研人員,已經(jīng)有很多將艾倫腦的基因表達(dá)數(shù)據(jù)與神經(jīng)影像數(shù)據(jù)結(jié)合分析,已經(jīng)有了不少的成果,然而各個(gè)研究小組之間缺乏標(biāo)準(zhǔn)化,導(dǎo)致了很多使用這些數(shù)據(jù)的處理流程。abagen是一個(gè)用于處理轉(zhuǎn)錄組數(shù)據(jù)的開源工具箱,給出了標(biāo)準(zhǔn)化的處理流程,該文章發(fā)表在eLife上,對(duì)于想使用艾倫腦圖譜數(shù)據(jù)庫(kù)而自己又難以對(duì)數(shù)據(jù)進(jìn)行處理的研究者只使用該工具箱,使用大牛的分析流程,可減少不必要的麻煩(被審稿人質(zhì)疑)和節(jié)約時(shí)間成本。
abagen工具箱的使用|獲取基于大腦分區(qū)的基因表達(dá)數(shù)據(jù)
abagen一個(gè)python的工具箱,目前最新版本是0.1.3,對(duì)于python環(huán)境的基礎(chǔ)要求如下。我自己的測(cè)試環(huán)境是搭建的anocanda 3.10環(huán)境,測(cè)試可以使用。
nibabel
numpy>=1.14.0
pandas>=0.25.0
scipy
安裝流程
因?yàn)閲?guó)外的包下載非常慢,因此使用鏡像源安裝
pip install abagen -i https://pypi.douban.com/simple/
因?yàn)樵摪ㄟ^ conda install abagen無法搜索到包,因此在conda環(huán)境中也只能通過pip安裝
下載6名捐獻(xiàn)者的轉(zhuǎn)錄組數(shù)據(jù)
官方提供的方法如下:
1.安裝io模塊(用于連接艾倫研究所的官網(wǎng)下載數(shù)據(jù))
2.import abagen
files = abagen.fetch_microarray(donors='all', verbose=0)
3.上述代碼可以將6捐獻(xiàn)者的數(shù)據(jù)下載到默認(rèn)路徑下$HOME/abagen-data,通常是C盤的用戶目錄下,
你也可以指定data_dir將數(shù)據(jù)下載到指定目錄下。
4. 6名捐獻(xiàn)者的數(shù)據(jù)大約有4G,且服務(wù)器在國(guó)外,大概率程序會(huì)運(yùn)行很久然后報(bào)錯(cuò)(血淚史)
本文提供的方法:
- 直接到到官網(wǎng)進(jìn)行數(shù)據(jù)的下載 AHBA microarray data
- 將數(shù)據(jù)放在任意的一個(gè)文件夾內(nèi),后續(xù)加載數(shù)據(jù)直接指定該文件夾即可
- 官網(wǎng)的下載頁(yè)面如下,下載圈出來的數(shù)據(jù)即可,其它的按需下載:
- 網(wǎng)站服務(wù)器在國(guó)外,不確定能否打開,如果實(shí)在沒辦法可以聯(lián)系博主獲取。
獲取基于大腦分區(qū)的基因表達(dá)數(shù)據(jù)
abagen的主要流程如下圖所示(論文原圖)
通過該工具箱,輸入大腦的分區(qū)模板,即可得到一個(gè)【腦區(qū)*基因】的矩陣,具體的代碼如下
import abagen
存放6個(gè)捐獻(xiàn)者數(shù)據(jù)的文件夾
data_dir = '~\microarray'
大腦分區(qū)數(shù)據(jù)(可以是surface也可以是volume)
atlas_file = 'AAL.nii'
核心代碼,用于獲取基因表達(dá)矩陣
expression = abagen.get_expression_data(atlas_file, missing='centroids',data_dir=data_dir)
用于保存數(shù)據(jù)到csv
expression.to_csv('glasser360MNI_LR.nii_centroids.csv')
- 其中missing表示如果該腦區(qū)沒有采集到基因表達(dá)數(shù)據(jù)的處理方式,即插值(兩種方式),或者對(duì)應(yīng)腦區(qū)不做處理
- 可選的值如下:{‘centroids’, ‘interpolate’, None}
- centroids:該區(qū)域的值于最近的樣本組織的基因表達(dá)數(shù)值一致。
- interpolate:采用反距離加權(quán)平均進(jìn)行插值
- None:不做處理,賦值NAN
如果是皮層數(shù)據(jù),上面代碼中的atlas可以按照如下方式導(dǎo)入
from abagen import images
atlas = ('/.../fsaverage6-lh.label.gii', '/.../fsaverage6-rh.label.gii')
surf = ('/.../fsaverage6-lh.surf.gii', '/.../fsaverage6-lh.surf.gii')
atlas = images.check_atlas(atlas, geometry=surf, space='fsaverage6')
其中微陣列文件夾data_dir數(shù)據(jù)組織形式如下
├── normalized_microarray_donor10021/
│ ├── MicroarrayExpression.csv
│ ├── Ontology.csv
│ ├── PACall.csv
│ ├── Probes.csv
│ └── SampleAnnot.csv
├── normalized_microarray_donor12876/
├── normalized_microarray_donor14380/
├── normalized_microarray_donor15496/
├── normalized_microarray_donor15697/
└── normalized_microarray_donor9861/
get_expression_data的默認(rèn)參數(shù)文章來源:http://www.zghlxwxcb.cn/news/detail-596898.html
def get_expression_data(atlas,atlas_info=None,*,
ibf_threshold=0.5,
probe_selection='diff_stability',
donor_probes='aggregate',
sim_threshold=None,
lr_mirror=None,
exact=None, missing=None,
tolerance=2,
sample_norm='srs',
gene_norm='srs',
norm_matched=True,
norm_structures=False,
region_agg='donors',
agg_metric='mean',
corrected_mni=True,
reannotated=True,
return_counts=False,
return_donors=False,
return_report=False,
donors='all',
data_dir=None,
verbose=0,
n_proc=1):
聲明
- 本文更多的是給大家提供一個(gè)快速使用該開源工具箱的方法,降低方法使用的門檻,讓大家不用把時(shí)間浪費(fèi)在搭建環(huán)境編寫腳本等坑上面;如果需要對(duì)參數(shù)進(jìn)行定制則需要仔細(xì)閱讀工具箱手冊(cè)及相應(yīng)的論文對(duì)處理的流程有整體的理解。
- 個(gè)人水平有限,歡迎大佬指正,歡迎友好交流!
參考文獻(xiàn):文章來源地址http://www.zghlxwxcb.cn/news/detail-596898.html
- Markello, RD, Arnatkevic?iūt?, A, Poline, J-B, Fulcher, BD, Fornito, A, & Misic, B. (2021). Standardizing workflows in imaging transcriptomics with the abagen toolbox. Biorxiv. doi:10.1101/2021.07.08.451635
- Arnatkevic?iūt?, A, Fulcher, BD, & Fornito, A. (2019). A practical guide to linking brain-wide gene expression and neuroimaging data. NeuroImage, 189, 353-367. doi:10.1016/j.neuroimage.2019.01.011
- Hawrylycz, MJ, Lein, ES, Guillozet-Bongaarts, AL, Shen, EH, Ng, L, Miller, JA, …, & Jones, AR. (2012). An anatomically comprehensive atlas of the adult human brain transcriptome. Nature, 489(7416), 391–399. doi:10.1038/nature11405
- https://abagen.readthedocs.io/en/stable/citing.html
- https://human.brain-map.org/static/download
到了這里,關(guān)于一個(gè)用于Allen腦圖譜基因數(shù)據(jù)的工具箱|abagen詳細(xì)使用教程-獲取基于腦區(qū)的基因表達(dá)矩陣(腦區(qū)*gene)的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!