侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

臨床基本信息當(dāng)作變量輕松發(fā)2+分專業(yè)期刊

2021-02-03 08:37
科研菌
關(guān)注

       今天要和大家分享的是一篇2+分的學(xué)習(xí)筆記。這篇學(xué)習(xí)筆記使用了GEO數(shù)據(jù)庫(kù)的數(shù)據(jù),進(jìn)行了差異表達(dá)基因的篩選、GO和KEGG富集分析、PPI網(wǎng)絡(luò)分析,確定了阿爾茨海默病(Alzheimer’s disease,AD)發(fā)病過(guò)程中關(guān)鍵的差異表達(dá)基因(DEGs)和通路,找到了AD的潛在生物標(biāo)志物。

題目:阿爾茨海默病不同腦區(qū)異常調(diào)控基因和通路的鑒定

圖片標(biāo)題

一、 研究背景

阿爾茨海默病(Alzheimer disease,AD)是一種慢性進(jìn)行性神經(jīng)退行性疾病。目前對(duì)AD的病理生理機(jī)制尚未完全了解。所以這篇學(xué)習(xí)筆記對(duì)阿爾茨海默病患者和正常對(duì)照的腦組織(包括海馬組織—HIP、顳回組織—TG、額回組織—FG和全血—WB)的可用基因表達(dá)譜進(jìn)行了綜合分析。以確定阿爾茨海默病發(fā)病機(jī)制中的關(guān)鍵差異表達(dá)基因和途徑,獲得潛在的阿爾茨海默病診斷生物標(biāo)志物,為今后研究中阿爾茨海默病診斷生物標(biāo)志物和治療靶點(diǎn)的確定提供有價(jià)值的信息。

二、分析流程

三、結(jié)果解讀1. 鑒定差異表達(dá)基因(DEGs)

       從GEO數(shù)據(jù)庫(kù)中篩選16個(gè)數(shù)據(jù)集,包括海馬組織(HIP)六個(gè)、顳回組織(TG)三個(gè)、額葉回組織(FG)三個(gè)和全血(WB)四個(gè),詳細(xì)信息如表1所示。篩選標(biāo)準(zhǔn)為:

數(shù)據(jù)集為全基因組表達(dá)數(shù)據(jù)(數(shù)據(jù)完整)

數(shù)據(jù)庫(kù)來(lái)源于所需要研究的組織(數(shù)據(jù)與研究相關(guān))

表1. 數(shù)據(jù)集的詳細(xì)信息

       由于在HIP、TG和FG組織中的比較數(shù)據(jù)來(lái)源于多個(gè)數(shù)據(jù)集,所以需要對(duì)這些數(shù)據(jù)使用了log2轉(zhuǎn)換進(jìn)行歸一化處理,并且使用R包 metaMA合并這些數(shù)據(jù)集。接著計(jì)算單個(gè)基因的p值,并使用Benjamini & Hochberg法計(jì)算多重比較校正的錯(cuò)誤發(fā)現(xiàn)率(FDR),然后篩選出FDR < 0.01的基因,于是得到了DEGs。

       為了驗(yàn)證在這三個(gè)組織中,對(duì)照組和AD組的基因的表達(dá)是存在差異的,于是利用這些數(shù)據(jù)繪出在三個(gè)組織中的基因表達(dá)熱圖。

熱圖的紅色代表了上調(diào)表達(dá),綠色代表了下調(diào)表達(dá)。以TG組織為例,可以看到在TG中表達(dá)的基因大致可以分成兩類:一類是上面一組,代表了對(duì)照組高表達(dá)而AD組低表達(dá)(左上紅色塊和右上綠色塊);一類是下面一組,代表了對(duì)照組低表達(dá)而AD組高表達(dá)(左下綠色塊和右下紅色塊)。

圖1. 在三個(gè)組織中的差異表達(dá)基因DEGs熱圖

       從三個(gè)組織篩選得到的所有數(shù)據(jù)集中篩選出了325個(gè)DEGs。篩選標(biāo)準(zhǔn)為:FDR <0.01(FDR是指錯(cuò)誤發(fā)現(xiàn)率,一般取FDR<0.01作為默認(rèn)標(biāo)準(zhǔn))。圖2中,三個(gè)組織樣本中的差異表達(dá)基因的交集即為3個(gè)組織樣本中表達(dá)均有差異的基因(上調(diào)的117個(gè),下調(diào)的148個(gè),總共325個(gè))。

圖2. 篩選得到的上調(diào)和下調(diào)表達(dá)的DEGs

2. GO和KEGG富集分析

       使用Gene codis 3軟件對(duì)未與全血樣本重合的325個(gè)DEGs進(jìn)行富集分析(FDR < 0.05)。富集結(jié)果如下圖3所示。從圖中可以看到這些基因在與AD有關(guān)的信號(hào)通路中出現(xiàn)了顯著的富集,比如:在HIP中,參與粘附體連接的途徑;在FG中,Wnt信號(hào)通路;此外,MAPK信號(hào)通路也出現(xiàn)了明顯的富集。

圖3. KEGG富集分析結(jié)果

       325個(gè)DEGs的GO和KEGG富集分析的詳細(xì)結(jié)果如下表所示(表2)。從GO分析結(jié)果可以看出這些基因在凋亡過(guò)程調(diào)節(jié)、凋亡過(guò)程和細(xì)胞死亡等基因功能出現(xiàn)了明顯的富集。

表2. GO和KEGG富集分析表

3. PPI網(wǎng)絡(luò)構(gòu)建

       利用BioGRID數(shù)據(jù)庫(kù)和Cytoscape軟件構(gòu)建來(lái)PPI網(wǎng)絡(luò),尋找核心調(diào)控基因(hub genes)。利用前20個(gè)上調(diào)和下調(diào)基因來(lái)構(gòu)建PPI網(wǎng)絡(luò)。

小編以HIP為例(圖4)進(jìn)行說(shuō)明:圖中紅色的圓點(diǎn)代表了上調(diào)表達(dá)的基因,藍(lán)色的圓點(diǎn)代表了下調(diào)表達(dá)的基因,三角形基因代表了與其它基因連接度高的基因。PPI網(wǎng)絡(luò)篩選核心調(diào)控基因的原理也就是根據(jù)一個(gè)基因和其余基因的連接度(connectivity)的大小來(lái)篩選的,簡(jiǎn)而言之就是圖中基因周圍線最多的基因就是我們需要尋找的核心調(diào)控基因。

圖4. 根據(jù)HIP的DEGs構(gòu)建的PPI網(wǎng)絡(luò)

       通過(guò)在HIP、TG、FG的PPI網(wǎng)絡(luò)中的基因進(jìn)行連接度從高到低排序,可以得到以下結(jié)果:

在HIP的PPI網(wǎng)絡(luò)中,YAP1的連接度最高,與18個(gè)DEGs相互作用;

在TG的PPI網(wǎng)絡(luò)中,MAPK9的連接度最高,與16個(gè)DEGs相互作用;

在FG的PPI網(wǎng)絡(luò)中,GJA1的連接度最高,與6個(gè)DEGs相互作用。

4. 在全血樣本中尋找DEGs

       為了尋找血液中的生物標(biāo)志物,需要單獨(dú)對(duì)全血樣本進(jìn)行差異表達(dá)基因DEGs的篩選,篩選方法同上。作者總共篩選到了2101個(gè)DEGs,并將HIP、TG、FG和WB共有的DEGs篩選出來(lái),總共篩選到了40個(gè)DEGs(圖5)。

圖5. 全血標(biāo)本中基因表達(dá)熱圖(A);利用韋恩圖篩選4個(gè)組織樣本中共有的差異表達(dá)基因(B)

       進(jìn)一步將四個(gè)組織樣本中共有的40個(gè)DEGs進(jìn)行富集分析。這些DEGs在脂肪細(xì)胞因子信號(hào)通路、細(xì)胞因子-細(xì)胞因子受體相互作用和阿爾茨海默病相關(guān)通路出現(xiàn)了顯著的富集(圖6)。

圖6. 40個(gè)DEGs的富集結(jié)果

       構(gòu)建PPI網(wǎng)絡(luò)發(fā)現(xiàn),在WB的PPI網(wǎng)絡(luò)中,TNFRSF1A和MAP3K5的連接度最高,分別與152個(gè)和76個(gè)DEGs有相互作用(圖7)。

圖7. 根據(jù)WB的DEGs構(gòu)建的PPI網(wǎng)絡(luò)

4. 驗(yàn)證

       這一部分分為兩步

       第一步的思路是:使用驗(yàn)證集進(jìn)行DEGs的篩選,并與之前篩選得到的40個(gè)DEGs進(jìn)行對(duì)比,驗(yàn)證之前篩選得到的DEGs與驗(yàn)證集是否一致,同時(shí)篩選HIP、TG、FG、WB以及驗(yàn)證集中表達(dá)都有顯著差異的基因用于下一步驗(yàn)證。

       第一步的詳細(xì)過(guò)程為:利用腦組織HIP的驗(yàn)證集GSE1297篩選到了35個(gè)DEGs,并比較這35個(gè)基因中31個(gè)常見的基因與之前篩選得到的40個(gè)DEGs的基因表達(dá)情況,發(fā)現(xiàn)它們的表達(dá)上調(diào)或下調(diào)情況一致。然后篩選了HIP、TG、FG、WB以及驗(yàn)證集中表達(dá)都有顯著差異的基因14個(gè)(圖8),這些DEGs包括:

顯著上調(diào)表達(dá)的:ARHGEF40、WWC3、VCAN、SSH3、SAFB2、LRCH4、IL10RA、CDK13、BBX和SPSB3;

顯著下調(diào)表達(dá)的:MRPL15、COPS3、TXNDC9和RAD51C

圖8. 差異表達(dá)基因在正常組織和AD患者HIP組織中的表達(dá)情況(箱線圖左邊代表正常組織,右邊代表了AD患者的HIP組織)

       第二步的思路是:對(duì)篩選的到的DEGs的診斷價(jià)值進(jìn)行驗(yàn)證。

       第二步的詳細(xì)過(guò)程為:利用全血樣本W(wǎng)B的驗(yàn)證集GSE63060和GSE63061對(duì)上述驗(yàn)證過(guò)程中篩選得到的14個(gè)DEGs進(jìn)行了ROC分析。ROC曲線由pROC繪出,使用AUC(ROC曲線下面積)以評(píng)估各DEG的診斷價(jià)值,當(dāng)AUC值大于0.6時(shí),認(rèn)為DEG能夠區(qū)分病例和正常對(duì)照。結(jié)果發(fā)現(xiàn)在這14個(gè)DEGs中只有MRPL15、RAD51C、SAFB2、SSH3、TXNDC9、VCAN和WWC3能夠區(qū)分AD患者與健康對(duì)照的WB樣本(圖9)。

圖9. 7個(gè)DEGs的ROC曲線

小結(jié)

       這篇學(xué)習(xí)筆記先是篩選出AD的HIP、TG和FG組織中的DEGs;然后進(jìn)行GO和KEGG富集分析;接著構(gòu)建了PPI網(wǎng)絡(luò),發(fā)現(xiàn)YAP1、MAPK9和GJA1是HIP、TG和FG組織中的核心調(diào)控基因。為了在血液中尋找生物標(biāo)志物,在WB、HIP、TG和FG找到了表達(dá)都有顯著差異的40個(gè)DEGs;下一步利用驗(yàn)證集對(duì)40個(gè)DEGs進(jìn)一步進(jìn)行篩選,找到了14個(gè)DEGs;最后驗(yàn)證了這14個(gè)DEGs的診斷價(jià)值,發(fā)現(xiàn)有7個(gè)DEGs可以作為診斷標(biāo)志物。這篇學(xué)習(xí)筆記的套路簡(jiǎn)單易懂,值得我們學(xué)習(xí)。

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

醫(yī)療科技 獵頭職位 更多
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)