日本做爰无遮A片免费,扌喿辶畐的日本,鲁大师在线观看日本电影,《内衣办公室》日本动漫,巜饥渴的人妻日本》中字,强壮的公次次弄得我高潮A片日本

結(jié)直腸癌多標(biāo)記轉(zhuǎn)錄分類反映腫瘤細(xì)胞群體的異質(zhì)性

欄目:最新研究動態(tài) 發(fā)布時間:2023-08-10
將CRIS亞型同時分配給同一CRC樣本,它仍保留其生物學(xué)和臨床特征,這種方法有潛力在其他癌癥類型和分類系統(tǒng)中推廣應(yīng)用......


       背景:轉(zhuǎn)錄分類已被用于將結(jié)直腸癌(CRC)分成具有不同生物學(xué)和臨床特征的分子亞型。然而,目前尚不清楚這些亞型是否代表著離散的、互斥的實(shí)體,還是具有潛在重疊的分子/表型狀態(tài)。因此,我們將重點(diǎn)放在CRC固有亞型(CRIS)分類器上,并評估將多個CRIS亞型分配給同一樣本是否提供額外的臨床和生物學(xué)相關(guān)信息。
       方法:我們使用CRIS分類器的多標(biāo)簽版本(multiCRIS)對新生成的606個CRC患者來源的異種移植物(PDXS)的RNA測序數(shù)據(jù)進(jìn)行了分析,同時結(jié)合了人類CRC批量和單細(xì)胞RNA測序數(shù)據(jù)集。比較了單標(biāo)簽和多標(biāo)簽CRIS的生物學(xué)和臨床相關(guān)性。最后,開發(fā)了基于機(jī)器學(xué)習(xí)的多標(biāo)簽CRIS預(yù)測器(ML2CRIS)用于單個樣本的分類。
       結(jié)果:令人驚訝的是,約一半的CRC病例可以明顯地分配給多個CRIS亞型。單細(xì)胞RNA測序分析揭示,多個CRIS成員身份可能是由于同時存在不同CRIS類別的細(xì)胞,或者較少情況下由于具有混合表型的細(xì)胞。發(fā)現(xiàn)多標(biāo)簽分配可以改善對CRC預(yù)后和治療反應(yīng)的預(yù)測。最后,ML2CRIS分類器在單個樣本分類的情境下被驗(yàn)證具有相同的生物學(xué)和臨床相關(guān)性。
       結(jié)論:這些結(jié)果表明,即使同時分配給同一CRC樣本,CRIS亞型仍保留其生物學(xué)和臨床特征。這種方法有潛力在其他癌癥類型和分類系統(tǒng)中推廣應(yīng)用。
       該研究于2023年5月發(fā)表發(fā)表在《Genome medicine》,IF:15.266。
       技術(shù)路線:



       實(shí)驗(yàn)方法:異種移植物收集、TCGA和PDX RNA-SEQ數(shù)據(jù)預(yù)處理、CRC單細(xì)胞數(shù)據(jù)及其預(yù)處理、bulk/scRNA-seq數(shù)據(jù)和預(yù)處理、scRNA-seq數(shù)據(jù)的偽批量、CRIS分類、單標(biāo)簽分級機(jī)、多標(biāo)號單樣分級機(jī)。

1、結(jié)直腸癌內(nèi)在亞型的多標(biāo)簽CRIS分層研究
       為了改善結(jié)直腸癌的分層,并根據(jù)CRIS分類捕捉生物特征,我們推斷其最近模板預(yù)測(NTP)算法不僅可以用于指定最顯著的單一類別,還可以評估每個樣本對所有CRIS類別的分配,以及每個分配的虛假發(fā)現(xiàn)率。因此,我們實(shí)施了基于NTP的CRIS分類器的新的多標(biāo)簽版本,名為“multiCRIS”,能夠根據(jù)與每個CRIS中心點(diǎn)的距離和其顯著性將每個樣本分配給一個或多個CRIS類別。
首先,將MultiCRIS應(yīng)用于來自癌癥基因組圖譜(TCGA)的620個樣本的RNA測序數(shù)據(jù)集,以明確地將91%的樣本至少分配給一個類別(圖1a)。有趣的是,52%的樣本還可以被確信地分配給其他CRIS亞型(圖1b)。
       值得注意的是,對于所有的CRIS亞型,次要分配的數(shù)量與主要分配大致相等(圖1c)。多重分配主要發(fā)生在兩個特定的亞家族之間:CRISA/CRIS-B和CRIS-C/CRIS-D/CRIS-E。最后,為了評估這些多重分配是否捕捉到具有多個CRIS生物特征的腫瘤,我們探索了與每個CRIS類別相關(guān)的主要特征。
       有趣的是,分配給次要類別的樣本在圖1d中顯示了類別的關(guān)鍵分子特征,包括CRIS-A中的MSI狀態(tài),CRIS-C中的KRAS突變的消失,以及CRIS-D/CRIS-E中的WNT信號通路活性和CRIS-B樣本中的上皮間質(zhì)轉(zhuǎn)化(EMT)。值得注意的是,我們觀察到具有多個分配的樣本傾向于與CRIS中心點(diǎn)之間的距離較大,這可能反映了同時具有不同表型的細(xì)胞組成或具有不同表型的細(xì)胞混合的情況。


圖1展示了針對TCGA數(shù)據(jù)集中的596個結(jié)直腸癌樣本進(jìn)行的多標(biāo)簽CRIS分類的結(jié)果。


2、多個CRIS分配中的單細(xì)胞異質(zhì)性。
       觀察到一部分結(jié)直腸癌的多個類別分配可以通過兩種方式解釋:腫瘤由具有模糊表型的癌細(xì)胞組成,或者存在混合的不同亞型細(xì)胞群體。為了探索支持多個CRIS分配的異質(zhì)性,我們在一個由PDXS(患者源性異種移植)衍生的5個結(jié)直腸癌器官樣本集合中進(jìn)行了一系列的配對單細(xì)胞RNA測序(scRNA-seq)和批量譜分析。這些數(shù)據(jù)允許直接比較單細(xì)胞和批量轉(zhuǎn)錄組譜分析結(jié)果。作為第三個選擇,通過聚合一個樣本中所有單細(xì)胞譜分析結(jié)果來獲得偽批量譜分析結(jié)果。值得注意的是,盡管來自單個細(xì)胞的譜分析結(jié)果平均捕獲了至少5個支持讀數(shù)的1116個轉(zhuǎn)錄本,但偽批量譜分析結(jié)果平均涵蓋了超過17,095個轉(zhuǎn)錄本。如預(yù)期的那樣,匹配的批量/偽批量樣本的譜分析結(jié)果顯示了強(qiáng)烈的相關(guān)性,而無法通過非匹配比較獲得。這些結(jié)果表明,(i)單細(xì)胞譜分析結(jié)果顯示出高度的異質(zhì)性,以及(ii)聚合的單細(xì)胞譜分析結(jié)果能夠重現(xiàn)批量譜分析結(jié)果中所獲得的轉(zhuǎn)錄組譜。因此,這種3D體外器官樣本培養(yǎng)系統(tǒng)捕獲了具有復(fù)雜轉(zhuǎn)錄組異質(zhì)性的細(xì)胞譜。
       值得注意的是,我們發(fā)現(xiàn)存在同時存在的細(xì)胞混合物,每個混合物具有一個單一的CRIS分配,以及具有混合多個CRIS亞型的細(xì)胞。來自給定器官樣本的個別細(xì)胞主要被分配到該器官樣本的批量譜分析結(jié)果所定義的CRIS亞型/亞型組(圖2)。
       這些結(jié)果強(qiáng)調(diào)了在單細(xì)胞分辨率下,大多數(shù)細(xì)胞被分配到單個CRIS亞型,并且它們的混合導(dǎo)致了批量轉(zhuǎn)錄組的多亞型分配;然而,也有可能存在一小部分具有混合表型的細(xì)胞,在給定的批量樣本中對多個CRIS亞型的分配產(chǎn)生貢獻(xiàn)。事實(shí)上,在所有接受多個CRIS批量分配的器官樣本中,我們檢測到了具有不同CRIS標(biāo)識的細(xì)胞和具有混合表型的細(xì)胞的共存(圖2)。
       為了將我們的觀察擴(kuò)展到人類腫瘤,我們利用來自一組患者的公共單細(xì)胞RNA測序數(shù)據(jù)(GSE132465),重點(diǎn)關(guān)注上皮細(xì)胞,比較偽批量和單細(xì)胞的多標(biāo)簽CRIS分配情況:這種分析證實(shí)了存在多個CRIS分配的患者。在這些樣本中,我們證實(shí)大多數(shù)單個細(xì)胞被分配到特定的CRIS亞型(64%的分類細(xì)胞,其中75%被分配到單個CRIS亞型,25%被分配到多個CRIS組;圖3a)。然而,類似于器官樣本,每個樣本由不同的細(xì)胞群體組成,這些細(xì)胞群體被分到不同的CRIS亞型中,導(dǎo)致了一個復(fù)雜的表型,該表型通過偽批量分析的多個CRIS分配被捕捉到(圖3b)。因此,被分配到單個CRIS亞型的樣本往往具有更高比例的被分配到該亞型的細(xì)胞。在特定樣本中,具有多標(biāo)簽分配的單個細(xì)胞的高百分比可能反映出組織中正在經(jīng)歷功能轉(zhuǎn)變或穩(wěn)定的中間分化階段。例如,在患者SMC17中發(fā)生了這種情況(圖3b),其中57%的分類細(xì)胞顯示出多標(biāo)簽表型。類似地,SMCO3和SMC21患者分別顯示出34%和28%的具有混合表型的細(xì)胞(圖3b),與它們在批量分析中追蹤到的多標(biāo)簽狀態(tài)一致。
       總的來說,這些結(jié)果表明,CRIS轉(zhuǎn)錄組的異質(zhì)性根源于單個細(xì)胞水平,而單個細(xì)胞的表型總結(jié)起來定義了腫瘤批量的CRIS分類。因此,多CRIS腫瘤的證據(jù)主要可以通過具有特定功能特征的不同細(xì)胞群體的鑲嵌組成或具有混合表型的少量混合細(xì)胞來解釋。



圖2展示了人類器官樣品的MultiCRIS分類結(jié)果。

圖3展示了人類結(jié)腸直腸癌(CRC)的MultiCRIS分類結(jié)果。

3、針對CRIS分類的單樣本方法
       MultiCRIS為復(fù)雜的生物學(xué)和臨床結(jié)果鋪平了道路。然而,它受到其NTP實(shí)現(xiàn)的影響,該實(shí)現(xiàn)依賴于在樣本批次上計算的質(zhì)心距離和基因級別的Z分?jǐn)?shù),不允許單個樣本的分類。為了克服這個問題,我們轉(zhuǎn)向單樣本算法,能夠獨(dú)立地對每個樣本進(jìn)行分類:這些算法既可以處理只對主要類別進(jìn)行單標(biāo)簽分配的情況(SC),也可以處理多標(biāo)簽分配的情況(MC),以捕捉內(nèi)部的異質(zhì)性。我們的工作流程如圖4所示;它包括對所有算法進(jìn)行初始訓(xùn)練階段(藍(lán)色),在測試數(shù)據(jù)上對它們的性能進(jìn)行評估(粉色),以及對最有希望的單樣本方法進(jìn)行最終的臨床和生物驗(yàn)證(綠色)。我們首先實(shí)現(xiàn)了單樣本單標(biāo)簽算法,能夠識別每個樣本的最顯著(主要)類別??紤]的方法包括隨機(jī)森林(RF)、線性支持向量機(jī)(LSVM)、多項(xiàng)式(PSVM)和高斯徑向基函數(shù)(GRBF-SVM)核的支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)(NN)和極端梯度提升樹(XGBoost)。隨后,通過提取每個樣本的所有CRIS類成員關(guān)系,TESE單樣本算法被適應(yīng)于多標(biāo)簽上下文;這使得能夠?qū)φ斩鄻?biāo)簽NTP(多CRIS)的結(jié)果來驗(yàn)證其結(jié)果。
       為了評估每個算法并確定最適合在臨床應(yīng)用的單樣本分類器中預(yù)測CRIS類別成員資格的算法,我們利用了來自TCGA項(xiàng)目的原發(fā)性結(jié)直腸癌樣本集(n=562)和來自患者衍生的異種移植瘤(PDXS,n=550)的隊列。TCGA數(shù)據(jù)被分成訓(xùn)練集和測試集,保持整個數(shù)據(jù)集中CRIS類別比例不變。每個分類器僅考慮CRIS基因的表達(dá)值作為特征空間,并使用NTP主類作為目標(biāo)參考進(jìn)行訓(xùn)練,無論其是單標(biāo)簽還是多標(biāo)簽的使用。TCGA樣本的30%和完整的PDXS數(shù)據(jù)集被用作兩個獨(dú)立的測試集,以評估單標(biāo)簽和多標(biāo)簽分類器的結(jié)果。
       在針對主要類別分配的單標(biāo)簽評估中,我們使用全局準(zhǔn)確率、精確度和召回率,衍生的度量指標(biāo)(F1分?jǐn)?shù)和馬修斯相關(guān)系數(shù)(MCC)),以及基于閾值的度量指標(biāo)(接收器操作特性曲線下面積和精確率-召回率曲線下面積),以評估所考慮算法的性能,并將其與原始的NTP方法的性能進(jìn)行比較。LSVM在TCGA測試集上達(dá)到了約80%的準(zhǔn)確率,在PDXS上達(dá)到了75%的準(zhǔn)確率,在考慮了所有類別的精確度和召回率時表現(xiàn)良好(圖5)。雖然XGBoost和RF取得了有趣的表現(xiàn),但它們的類別特定行為似乎不太穩(wěn)定,并且整體上略遜于LSVM(圖5)。
       此外,在單標(biāo)簽情況下,機(jī)器學(xué)習(xí)方法與TSP方法進(jìn)行了比較,TSP方法是單樣本CRIS分類器的首次嘗試,最初顯示出與NTP分類的相當(dāng)有限的一致性。本研究中證實(shí)了其次優(yōu)結(jié)果:我們所有的分類器都比TSP獲得了更高的準(zhǔn)確性,最高準(zhǔn)確率為70.7%。特別是對于LSVM來說,即使在TCGA測試集上F1分?jǐn)?shù)最低的類別(CRIS-E,為73%)也顯著超過了TSP的結(jié)果(CRIS-E為28%)。
在PDXS數(shù)據(jù)集上,LSVM取得了最令人信服的結(jié)果。在TCGA中,CRIS-A是最常見的類別,略多于CRIS-C;其次是CRIS-E,而CRIS-B和CRIS-D的規(guī)模較小但可比較。在PDXS中幾乎可以觀察到相同的趨勢,例外就是CRIS-A類在PDXS中的表示較少,這是因?yàn)閬碜赞D(zhuǎn)移性結(jié)直腸癌的樣本中MSI病例(CRIS-A富集)的稀缺性。
       因此,基于性能評估,我們確定LSVM作為最佳的單標(biāo)簽分類器,用于預(yù)測每個單個CRC樣本的主要CRIS類別。然而,所有三種訓(xùn)練過的算法都能通過算法自適應(yīng)技術(shù)計算出對所有5個CRIS類別的隸屬度,為多標(biāo)簽情景奠定了基礎(chǔ)。


圖4展示了基于機(jī)器學(xué)習(xí)構(gòu)建單樣本CRIS分類器的工作流程。

圖5展示了基于機(jī)器學(xué)習(xí)的CRIS分類器的性能評估結(jié)果

4、通過單樣本方法,進(jìn)行多標(biāo)簽CRIS分類。
       在算法自適應(yīng)策略的基礎(chǔ)上,我們開發(fā)了多標(biāo)簽適應(yīng)(mla)的單樣本CRIS分類器。具體來說,每個mla算法從其單標(biāo)簽版本繼承了主要類別的分配能力,但可以將任何異質(zhì)樣本與一個或多個額外的次要類別關(guān)聯(lián)起來。
       為了評估m(xù)la分類器,我們使用了與單標(biāo)簽類似但適應(yīng)于多標(biāo)簽環(huán)境的度量指標(biāo)(放寬準(zhǔn)確率、精確率、召回率),以及特定的多標(biāo)簽度量指標(biāo)(平均精確率、Hamming損失、子集準(zhǔn)確率和多標(biāo)簽準(zhǔn)確率)。所有這些指標(biāo)都將mla算法的結(jié)果與本研究中引入的MultiCRIS方法獲得的目標(biāo)分配進(jìn)行比較。
       在mla算法中,LSVM在考慮類別精確率和召回率時仍然達(dá)到了最佳整體性能,顯示出在多標(biāo)簽環(huán)境中也是最穩(wěn)健的方法(圖5)。此外,LSVM在91.7%的情況下分配了主要的多標(biāo)簽CRIS類別(即根據(jù)NTP算法確定的最突出的類別),并且在預(yù)測TCGA測試樣本的多標(biāo)簽特征時達(dá)到了92.6%的平均精確度。在考慮Hamming損失時,即錯誤分類標(biāo)簽的平均比例,LSVM在TCGA測試集和PDXS集中都具有最低的損失比例。最后,LSVM的子集準(zhǔn)確率(嚴(yán)格相同的標(biāo)簽歸屬)也非常重要,尤其考慮到每個算法只通過提供主要類別作為參考目標(biāo)進(jìn)行訓(xùn)練。
       因此,LSVM顯然是在單標(biāo)簽或多標(biāo)簽視角下執(zhí)行單樣本分類的最佳方法。

5、單標(biāo)簽和多標(biāo)簽LSVM分類器的臨床和生物學(xué)評估
       我們首先評估了基于LSVM模型在TCGA數(shù)據(jù)集上的預(yù)后價值,考慮了不同的情景:僅考慮作為主要類別分配的樣本、僅考慮作為次要類別分配的樣本,或者考慮所有被分類為CRIS類別的腫瘤,不論其是主要還是次要分配。在所有這些情況下,使用Fisher檢驗(yàn)進(jìn)行的任何比較都是針對那些完全未被分配到所研究的CRIS類別的樣本。對于基于NTP和LSVM的單標(biāo)簽分類器,Kaplan-Meier(KM)生存分析證實(shí)了CRIS-B類與不良預(yù)后的顯著關(guān)聯(lián)(圖6a、b)。有趣的是,通過多標(biāo)簽分配,將次要CRIS-B分配的樣本從非CRIS-B組中排除,突出了與不良預(yù)后的更高的相關(guān)性(圖6c、d)。因此,當(dāng)排除具有主要CRIS-B分配的樣本進(jìn)行分析時,次要CRIS-B分配的樣本顯示出更差的預(yù)后(圖6e、f)。當(dāng)將主要和次要CRIS-B病例合并時,預(yù)后顯著性達(dá)到最大值(圖6g、h)。值得注意的是,在所有情況下,基于LSVM的分類器具有更高的預(yù)后顯著性。
       在PDXS隊列中評估了對抗EGFR治療的反應(yīng)。我們確認(rèn)了CRIS-C與Cetuximab的敏感性相關(guān)聯(lián),其中單標(biāo)簽LSVM(優(yōu)勢比(O.R.)= 3.281,置信區(qū)間(CI)= 1.66-6.73)和多標(biāo)簽LSVM,包括在CRIS-C隊列中的次要分配,顯示出類似的表現(xiàn)(O.R. = 3.36,CI = 1.24-10.64)。
       所有這些證據(jù)都證實(shí)了我們的LSVM單樣本模型的預(yù)測結(jié)果的可靠性,特別是mla LSVM,即ML2 CRIS(多標(biāo)簽機(jī)器學(xué)習(xí)CRIS)。ML2 CRIS能夠突出樣本的生物學(xué)內(nèi)在異質(zhì)性(如果有的話),同時在臨床應(yīng)用中對每個患者進(jìn)行個體化評估。這證明了ML2 CRIS在臨床使用環(huán)境中的可靠性。


圖6展示了單標(biāo)簽和多標(biāo)簽CRIS-B分類在預(yù)后方面的意義


參考文獻(xiàn):

Cascianelli, S., Barbera, C., Ulla, A.A. et al. Multi-label transcriptional classification of colorectal cancer reflects tumor cell population heterogeneity. Genome Med 15, 37 (2023).https://doi.org/10.1186/s13073-023-01176-5


木里| 秀山| 航空| 柳江县| 镇坪县| 芮城县| 任丘市| 庄浪县| 沂水县| 凤台县| 丹棱县| 扎鲁特旗| 赤壁市| 湾仔区| 桂林市| 贵州省| 宿州市| 武功县| 武定县| 义马市| 靖宇县| 扬中市| 从化市| 财经| 昌邑市| 塔城市| 崇仁县| 肇州县| 鸡东县| 本溪市| 寻甸| 布拖县| 台南市| 新干县| 闵行区| 中宁县| 越西县| 海原县| 林周县| 六枝特区| 察哈|