microRNA (miRNA) 是長(zhǎng)度為23nt左右的單鏈非編碼RNA,亦是豐富的調(diào)節(jié)性RNA,可作為基因轉(zhuǎn)錄后表達(dá)調(diào)節(jié)劑,主要指導(dǎo)其靶基因轉(zhuǎn)錄物的切割、降解和/或翻譯抑制。為此,對(duì)它們?cè)诮M織和細(xì)胞類(lèi)型中的豐度進(jìn)行準(zhǔn)確分類(lèi)是了解生理和病理?xiàng)l件下基因調(diào)控和失調(diào)的重要工具。同樣重要的是,在疾病和健康狀態(tài)之間或在疾病過(guò)程中,組織和生物體液中改變的 miRNA 水平可以區(qū)分疾病或與臨床表型和結(jié)果相關(guān)聯(lián),突出特定 miRNA 可能攜帶的診斷、預(yù)后或預(yù)測(cè)生物標(biāo)志物能力。有關(guān)miRNA在細(xì)胞類(lèi)型和組織中的表達(dá)和分布的信息對(duì)于理解它們的功能以及它們作為生物標(biāo)志物或治療靶點(diǎn)的轉(zhuǎn)化用途至關(guān)重要。
近日,希臘研究團(tuán)隊(duì)構(gòu)建了一個(gè)新的microRNA組織表達(dá)數(shù)據(jù)庫(kù)——DIANA-mitED,該數(shù)據(jù)庫(kù)相關(guān)文章刊登在Nucleic Acids Research期刊(IF=16.971),題名為DIANA-miTED: a microRNA tissue expression database。網(wǎng)址為http://www.microrna.gr/mited。
大多數(shù)可用數(shù)據(jù)庫(kù)要么包含少量數(shù)據(jù)集,要么僅或幾乎僅關(guān)注 TCGA,這主要是由于實(shí)際原因。TCGA 是一個(gè)相當(dāng)統(tǒng)一的資源,而 GEO/SRA 研究在文庫(kù)制備、使用的適配器和樣品質(zhì)量方面極為多樣化。DIANA-mitED 彌補(bǔ)了這一差距,使研究人員能夠研究迄今為止最廣泛的文庫(kù)中的 miRNA 表達(dá),以及從單一資源執(zhí)行簡(jiǎn)單或復(fù)雜的分析。DIANA-mitED包含SRA和TCGA中的15183個(gè)原始人類(lèi)小RNA-Seq(sRNA-Seq)數(shù)據(jù)集的分析,涵蓋了總共包含199個(gè)組織、82個(gè)解剖亞位、267個(gè)細(xì)胞系和261種疾病。
為了生成 miTED,我們利用 DIANA-mAP 分析工作流程對(duì)從TCGA和 SRA檢索到的>15000個(gè)sRNA-Seq數(shù)據(jù)集進(jìn)行了預(yù)處理和分析。在 miTED 中,用戶(hù)可以檢索一個(gè)或多個(gè)miRNA和/或組織/細(xì)胞系的表達(dá)值,識(shí)別最高表達(dá)的 miRNA,或感興趣的miRNA表達(dá)最多的最高組織/細(xì)胞系.
miTED實(shí)現(xiàn)了一個(gè)友好的在線圖形用戶(hù)界面,使用戶(hù)能夠搜索、瀏覽和元分析這個(gè)廣泛的集合,而無(wú)需生物信息學(xué)支持或?qū)I(yè)知識(shí)。DIANA-miTED通過(guò)Querying DB頂部菜單提供三個(gè)主要查詢(xún)頁(yè)面,即Multi-query、Top-miRNAs 和Top-sites。
在Multi-query頁(yè)面中,用戶(hù)可以查詢(xún)、檢索和比較組織或細(xì)胞系中一種或多種miRNA 的表達(dá)。搜索框允許自由文本搜索和選擇特定組織或細(xì)胞系和 miRNA。多查詢(xún)表單提供了將搜索限制為特定疾病的機(jī)會(huì),僅包括來(lái)自 SRA 或 TCGA 數(shù)據(jù)收集的結(jié)果,根據(jù)健康狀況(即“健康”或“疾病”)檢索數(shù)據(jù)。結(jié)果分為三個(gè)不同的部分。(A) 第一部分專(zhuān)門(mén)用于可視化檢索到的結(jié)果。分組箱線圖可以比較特定組織/疾病中的 miRNA 豐度。此外,通過(guò)描繪組織-疾病關(guān)系的桑基圖和性別、采集和健康狀況的餅圖探索樣本分布。(B) 第二部分滿(mǎn)足 miTED 結(jié)果與每個(gè) miRNA 的相關(guān) DIANA 資源(工具和數(shù)據(jù)庫(kù))的互連。(C)在第三部分中,提供了一個(gè)數(shù)據(jù)表,其中包含樣本元數(shù)據(jù)以及用戶(hù)請(qǐng)求的miRNA 的表達(dá)。
Top-miRNAs頁(yè)面是 miTED 資源中的第二個(gè)查詢(xún)頁(yè)面。通過(guò)此頁(yè)面,用戶(hù)可以搜索特定組織或細(xì)胞系中表達(dá)最高的 miRNA。顯示的結(jié)果包括以降序顯示所有 miRNA 表達(dá)的數(shù)據(jù)表和描繪所需組織或細(xì)胞系中最高表達(dá) miRNA 的條形圖。
Top-sites頁(yè)面專(zhuān)門(mén)用于檢索特定 miRNA 最豐富的組織或細(xì)胞系。與Top-miRNAs頁(yè)面類(lèi)似,結(jié)果包括一個(gè)表格,其中包含按降序排列的組織/細(xì)胞系的表達(dá)值,以及一個(gè)描述輸入表達(dá)最多的頂部組織或細(xì)胞系的條形圖。
DIANA-miTED 還通過(guò)其Visualizations菜單提供三個(gè)可視化頁(yè)面。第一頁(yè),提供了一個(gè)圖網(wǎng)絡(luò),描述了組織或起源器官與組織子區(qū)域之間的關(guān)系。它是一個(gè)交互式圖表,能夠突出顯示和移動(dòng)節(jié)點(diǎn),以探索它們之間的互連程度?!?/span>TCGA Projects Exploration”頁(yè)面包含用于分別探索 TCGA 數(shù)據(jù)集的組織-疾病和組織-性別關(guān)系的?;鶊D。