PLoS ONE: Hybrid modeller identificeret en 12-Gene Signature for lungekræft Prognose og Chemoresponse Prediction

Abstrakt

Baggrund

Lungekræft er stadig den hyppigste årsag til kræft-relaterede dødsfald på verdensplan. Den recidivraten spænder fra 35-50% blandt tidlige stadie ikke-små patienter celle lungekræft. Til dato er der ingen fuldt valideret og klinisk anvendte prognostiske gen signatur for personlig behandling.

Metodologi /vigtigste resultater

Fra genom-dækkende mRNA udtryk profiler genereret på 256 lunge adenocarcinom patienter, en 12-gen signatur blev identificeret ved hjælp af kombinatorisk gen udvælgelsesmetoder, og en risikoscore algoritme blev udviklet med

Naïve Bayes

. Den 12-gen-modellen genererer betydelig patient lagdeling i uddannelsen kohorte HLM UM (

n

= 256; log-rank

P

= 6.96e-7) og to uafhængige validering sæt, MSK (

n

= 104; log-rank

P

= 9.88e-4) og DFCI (

n

= 82; log-rank

P

= 2.57e-4), ved hjælp af Kaplan-Meier-analyser. Dette gen signatur stratifierer også trin I og IB lungeadenokarcinom patienter i to adskilte overlevelse grupper (log-rank

P

0,04). Den 12-gen risiko score er mere signifikant (hazard ratio = 4,19, 95% CI: [2,08, 8,46]) end andre almindeligt anvendte kliniske faktorer undtagen tumor stadie (III vs. I) i multivariat Cox-analyser. Den 12-genet model er mere præcis end tidligere publicerede lungekræft gen signaturer på de samme datasæt. Desuden er denne signatur præcist forudsiger kemoresistens /kemosensitivitet til cisplatin, carboplatin, paclitaxel, etoposid, Erlotinib og Gefitinib i NCI-60 cancer cellelinjer (

P

0,017). De identificerede 12 gener udviser kurateret interaktioner med store lungekræft signalering kendetegnende i funktionel pathway analyse. Udtrykket mønstre af signatur gener er blevet bekræftet i RT-PCR-analyser af uafhængige tumorprøver.

Konklusioner /Betydning

Resultaterne viser den kliniske anvendelighed af det identificerede gen signatur i prognostisk kategorisering. Med denne 12-gen risikoscore algoritme, kunne patienterne tidligt stadium med høj risiko for tumor tilbagefald identificeres for adjuverende kemoterapi; mens trin I og II patienter i lav risiko kunne blive skånet de toksiske bivirkninger af kemoterapeutiske stoffer

Henvisning:. Wan Y-W, Sabbagh E, Raese R, Qian Y, Luo D, Denvir J, et al. (2010) Hybrid modeller identificeret en 12-Gene Signature for lungekræft Prognose og Chemoresponse Prediction. PLoS ONE 5 (8): e12222. doi: 10,1371 /journal.pone.0012222

Redaktør: Jörg Hoheisel, Deutsches Krebsforschungszentrum, Tyskland

Modtaget: Maj 4, 2010; Accepteret: 20 juli 2010; Udgivet: 17 August, 2010

Copyright: © 2010 Wan et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Denne undersøgelse er støttet af NIH /NLM R01LM009500 (PI: Guo) og NCRR P20RR16440 og tillæg (PD: Guo). Den software licens og uddannelse for IPA og Pathway Studio blev støttet af NIH /NCRR P2016477. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Lungekræft er den hyppigste årsag til kræft-relaterede dødsfald i industrialiserede lande [1]. Lokale og fjernmetastaser er den største årsag til behandlingssvigt (dvs. dødsfald) i lungekræft. Øjeblikket, kirurgi er den forreste behandlingsmulighed for patienter med trin I ikke-småcellet lungekræft (NSCLC). , 35-50% af fase I NSCLC Dog patienter vil tilbagefald inden for 5 år [2], [3]. Det er fortsat en afgørende udfordring at bestemme risikoen for tilbagefald i den tidlige fase kræftpatienter. Patienter med høj risiko for tilbagefald kan have gavn af adjuverende kemoterapi, mens dem med en lav risiko for tumor tilbagefald kan blive skånet for de bivirkninger af kemoterapi. Efter dette, et andet kritisk spørgsmål i klinikker er at bestemme en individuel patients disposition for en specifik anticancerlægemiddel. Den nye anvendelse af biomarkører kan gøre det muligt for læger at gøre behandlingen beslutninger baseret på de særlige kendetegn ved de enkelte patienter og deres tumor, i stedet blot for på befolkningsstatistik [4].

De fremskridt i microarray teknologi giver løfte i den molekylære forudsigelse af den individuelle kliniske resultat. En sådan succes manifesterer sig ved de kommercielle gen test for brystkræft, Oncotype DX [5] og MammaPrint [6], [7]. Ikke desto mindre har den høje dimensionalitet af data komplicerede store diagnostiske og prognostiske gennembrud [8] og sætter en præmie på innovative metoder data mining. I de nuværende biomarkør identifikation studier er gener rangordnet efter deres tilknytning til det kliniske resultat, og de højest rangerede gener indgår i klassificeringen. Det er blevet bemærket, at de enkelte biomarkører, der viser stærk sammenhæng med resultatet er ikke nødvendigvis gode klassificører [9] – [11]. Desuden har hver enkelt gen udvælgelsesalgoritme har forskellige styrker og begrænsninger. . En hybrid model kombinere flere gen udvælgelsesmetoder kunne bedre identificere nye biomarkører fra high-throughput data til klinisk anvendelighed

Der har været et par undersøgelser om lungekræft prognose ved transskriptionsprofilering [12] – [19]. Til dato er der ingen fuldt valideret og klinisk anvendt model til forudsigelse lungekræft tilbagefald [20]. Denne undersøgelse viser en kombinatorisk gen selektionssystem til identificering af en 12-gen lungekræft prognostisk signatur. Denne 12-gen signatur er mere præcis i forhold til tidligere offentliggjorte signaturer i en multi-institutionel undersøgelse af lunge adenocarcinom (

n

= 442) [19]. Denne 12-gen signatur kunne identificere fase I og fase II-patienter, der kan have gavn af adjuverende kemoterapi og som kunne blive skånet for det. Kvantitativ RT-PCR-analyser af uafhængige NSCLC vævsprøver bekræftede genekspressionsmønstre af de identificerede biomarkører i form af tumor egenskaber. En funktionel sti analyse derefter viste, at signatur generne havde interaktioner med veletablerede kræft kendetegnende, med angivelse af de vigtigste roller signatur gener i tumor initiering og progression. Endvidere 12-genet signatur forudsiges nøjagtigt kemoresistens og kemosensitivitet til cisplatin, carboplatin, paclitaxel (Taxol), etoposid, Gefitinib og Erlotinib i et panel af 60 cancer cellelinier (NIC-60).

Resultater

Prognostisk modelsystem

i den post-genome æra, er hybrid-modeller, der udnytter forskellige algoritmer i forskellige stadier af gen udvælgelse nødvendig for biomarkør opdagelse og klassifikation sygdom. I denne undersøgelse, vi kombineret statistiske metoder og machine learning algoritmer til at identificere prognostiske biomarkører for lunge adenocarcinom. De kirurgiske resektioner indsamlet fra University of Michigan Cancer Center (UM) og Moffitt Cancer Center (HLM) danner den indstillede uddannelse (

n

= 256), mens de prøver fra Memorial Sloan-Kettering Cancer Center (MSK ,

n

= 104) og Dana-Farber Cancer Institute (DFCI,

n

= 82) udgør to uafhængige validering sæt. De kliniske karakteristika for de patientkohorter blev beskrevet i forrige publikation [19]

prognostisk undersøgelse omfatter tre faser (fig. 1):. 1) identifikation af et lille sæt af signatur gener ved at kombinere Betydning Analyse af mikroarrays (SAM) [21], forskellige-varians

t

-tests, og

Relief

algoritme fra genom-skala transkriptionelle profiler af uddannelsen kohorte (UM HLM), 2) konstruktion af en sorterer med

Naive Bayes

algoritme til at forudsige den samlede overlevelse i patienter med lungecancer, og 3) validering af genekspression-baserede prognostisk model i to uafhængige patientkohorter (MSK og DFCI). Uafhængige test sæt blev anvendt i modellen validering og evaluering af det identificerede gen signatur i forhold til tidligere offentliggjorte lungekræft prognostiske underskrifter.

Identifikation af en 12-gen prognostisk signatur

Et kombinatorisk ordning med flere gen udvælgelsesmetoder blev vedtaget i færd med at identificere en lungekræft prognostisk gen signatur. Det første skridt er valgt kandidatgener fra 22,283 sonder kvantificeres på uddannelse kohorte (

n

= 256). En kombination af

t

-tests og SAM blev derefter brugt til at vælge gener med ekspressionsniveauerne markant forskellig mellem lav-risiko (patient, der overlevede længere end 5 år) og høj-risiko (dem, der døde inden for 5 år efter kirurgi) grupper med en foruddefineret falsk opdagelse sats. Tyve-syv censurerede tilfælde med opfølgende tid mindre end 5 år blev fjernet fra denne analyse på grund af usikkerheden i patientens postoperative status. Specifikt en anden-varians

t

-test udvalgt 718 gener med betydelig differential udtryk (

P

0,01) mellem de to prognose grupper. Til at styre falsk opdagelse sats (

FDR

), SAM blev brugt til at vælge 1.431 gener, der væsentligt adskiller de to prognostiske grupper på en

FDR

på 25% (

delta

= 0,46). Der var 583 gener udvalgt af både

t

-tests og SAM, og disse blev anset for den næste fase af analysen.

For at forfine genet sat ind i en mere realistisk størrelse for klinisk anvendelse,

Relief

algoritme implementeret i WEKA 3.4 blev brugt til at rangere hver af disse 583 gener i form af magt for at adskille lav risiko og højrisikogrupper. Denne prioriteret liste blev anvendt i en trinvis fremad markering til at identificere et gen delmængde med den højeste prognosticering nøjagtighed. Specifikt startende fra toppen rangeret gen, blev et gen tilsat ved hvert trin til gensæt, indtil klassificeringen nøjagtighed ikke kunne forbedres ved at tilføje en yderligere gen. Dette gen sæt blev anvendt til at klassificere god prognose og dårlig prognose grupper med

Naïve Bayes

algoritme. Denne proces standses, når tilsætningen af ​​et nyt gen ikke forøgede klassificering nøjagtighed som vurderet i en 10-fold krydsvalidering. Som et resultat, en 12-gen signatur (tabel 1) blev identificeret som kunne give den bedste forudsigelse for den samlede overlevelse.

Survival forudsigelse ved hjælp 12-gen prognostisk model

Brug mRNA udtryk profiler af de identificerede 12 gener som prædiktorer, blev en prognostisk klassifikatør konstrueret til at stratificere patienterne i lav risiko (5-års overlevelse) og (ikke-5-års overlevelse) grupper med høj risiko.

Naïve Bayes

klassificeringen implementeret i WEKA 3.4 blev anvendt i klassificeringen på UM HLM uddannelse prøver (lav risiko

n

= 104; høj risiko

n

= 125). Tyve-syv censurerede tilfælde uden tilstrækkelig opfølgende oplysninger blev fjernet i modellen konstruktion. Priors anslået af modellen er 0,45 for lav risiko klasse og 0,55 for høj-risiko klasse. Andre parametre for den uddannede

Naïve Bayes

model, herunder middelværdi og standardafvigelse for hver af de 12 gener i både lav- og højrisikogrupper, er anført i tabel 2.

Naïve Bayes

klassificeringen beregner den bageste sandsynlighed for død inden for 5 år efter operationen i hver patient. Denne posterior sandsynlighed repræsenterer risikoen for tumor tilbagefald hos patienter, da gentagelse er den største årsag til behandlingssvigt (dvs. død) i lungekræft. Baseret på den bageste sandsynlighed, er en patient klassificeret i gruppen med høj risiko, hvis værdien er større end 0,5; eller i gruppe med lav-risiko andet. Uddannelsen model blev evalueret i en 10-fold cross validering. Uden parameter re-estimering, blev denne model anvendes derefter til at forudsige posterior sandsynlighed repræsenterer risikoen for tumor tilbagefald i hver patient i analyseprøverne sæt (MSK og DFCI), samt de censurerede tilfælde udeladt af modellen konstruktion. Fordelingen af ​​den posteriore sandsynlighed af 442 patienter i denne undersøgelse blev illustreret i fig. 2A. Efter opnåelse af de forventede resultater, blev Kaplan-Meier (KM) analyse at estimere den gennemsnitlige overlevelse sandsynlighed på 5 år mærket efter operationen. Resultaterne viser, at højrisiko-posteriors fra den prognostiske model er stærkt forbundet med de 5-års overlevelse sandsynligheder (Fig. 2B). Patienter med en høj sandsynlighed for tumortilbagevenden tendens til at være mere tilbøjelige til at have behandlingssvigt efter operationen. Dette indikerer, at den posteriore sandsynlighed højrisiko beregnet af modellen er en god prognostisk faktor for lungekræft overlevelse. Den brede 95% konfidensinterval på posteriors fra 0,35 til 0,6 (Fig. 2B) kan skyldes den lille prøvestørrelse i denne distribution (fig. 2A). Endvidere en bagende over 0,5 betyder, at chancen for tumortilbagevenden er tilfældig, hvilket også fører til en løsere konfidensinterval.

(A). Histogram viser fordelingen af ​​de risikofaktorer scores (posteriore sandsynligheder for høj risiko) i 442 lungeadenokarcinom patienter. (B). Gennemsnitlig sats for død på fem år efter operationen svarende til 12-gen score risiko (posterior mulighed). De stiplede linjer repræsenterer 95% konfidensinterval.

Brug af prognostiske kategorisering ordningen er beskrevet ovenfor, 12-gen signatur adskilte patienter i høj- og lavrisiko-grupper med signifikant forskellig (log-rank

P

= 6.96e-7) postoperativ overlevelse på uddannelse kohorte i Kaplan-Meier analyse (fig. 3A). Denne ordning genereret betydelig patient lagdeling på uafhængig validering sætter MSK (log-rank

P

= 9.88e-4;. Figur 3B) og DFCI (log-rank

P

= 2.57e-4 ;. figur 3C). Det 3-års postoperativ overlevelsesrate for lav-risikogrupper er 79-94% i de undersøgte kohorter, der repræsenterer en væsentlig bedre prognose sammenlignet med de tilsvarende høj-risiko grupper, for hvilke 3-års overlevelsen varierer fra 48% til 63 %. Når 3-års overlevelse blev anvendt til at definere høj og lav risikogrupper (høj risiko: død inden 3-y; lav risiko: live efter 3-y), 12-gen risiko algoritme opnåede en sensitivitet (korrekt forudsagt højrisiko patienter) af 73,65% i træningssættet, 86,96% i MSK, og 68,18% i DFCI, og en specificitet (korrekt forudsagt lav risiko patienter) af 59,21% i træningssættet, 57,75% i MSK, og 76,36 % i DFCI (tabel S9). Følsomheden og specificiteten af ​​12-genet signatur forudsige 5-års overlevelsen er også i tabel S9

Modellen lagdelte patienter i to signifikant forskellig (log-rank

P

6.96e-7) prognostiske grupper i træningssættet (A) i 10-fold validering kors. Uddannelsen model blev anvendt på to test sæt (B og C) og genereret betydelige patient lagdeling. Denne model separeret (log-rank

P

0,04) fase I-patienter i begge test sæt (D og E) samt fase IB patienter (log-rank

P

4,73 e-3) fra test sæt (F).

I den nuværende praksis, behandling for patienter diagnosticeret med NSCLC er baseret på AJCC tumor scenen. Kirurgisk resektion er den største behandlingsmulighed for trin I NSCLC patienter. , Omkring 35-50% af fase I NSCLC Men patienterne vil udvikle og dø af tumor tilbagefald inden for de fem år efter kirurgi [2], [3]. På den anden side, stadium IB patienter, som fik kirurgisk resektion efterfulgt af adjuverende kemoterapi viste forbedret overlevelsesrate [22]. Således har vi forsøgt at undersøge, om den 12-genet signatur kunne identificere specifikke højrisiko-patienter med trin I tumorer. Resultaterne viser, at den 12-genet prognostisk signatur pålideligt kunne identificere højrisiko-patienter med trin I tumorer på både uddannelse kohorte (resultater ikke vist) og to validering kohorter (log-rank

P

= 0,04, fig. 3D og 3E). Den prognostiske model også adskilt høj og lav risikogrupper (log-rank P = 4.73e-3) inden for fase IB patienter i de kombinerede test sæt (fig. 3F). Den 12-gen signatur ikke generere betydelig prognostisk lagdeling på scenen IA patienter (resultater ikke vist). Disse resultater viser, at den identificerede 12-gen signatur er uafhængig af og giver mere raffineret prognose end den nuværende AJCC staging system. Ved hjælp af denne model, fase I NSCLC patienter kan tilrådes at modtage adjuverende kemoterapi efter udtrykket profiler af de 12 gen-markører.

Behandling udvælgelse til fase I og II NSCLC patienter baseret på 12-genet signatur

for at vurdere, om 12-genet signatur kunne bruges til behandlingsvalg for trin i og II ikke-småcellet lungekræft, blev patienter, som ikke modtager kemoterapi udvalgt til yderligere analyse. Den prognostiske model adskilt høj og lav risiko trin I patienter uden kemoterapi i uddannelsen (UM HLM, log-rank

P

= 0,04, Fig 4A.) Og test kohorter (MSK DFCI; log-rank

P

= 0,02;. figur 4B). Tilsvarende modellen differentieret høj og lav risiko stadie II patienter uden kemoterapi i uddannelsen (log-rank

P

= 0,06;. Figur 4C) og test kohorter (log-rank

P

= 0,03;. figur 4D) i Kaplan-Meier-analyser. Resultaterne indikerer, at dette gen-ekspression-definerede prognostisk model pålideligt kunne udvælge patienter med tidlig fase NSCLC for adjuvans kemoterapi. I mellemtiden kunne det også spare nogle trin I og II NSCLC patienter fra kemoterapi baseret på ekspressionsmønstre af de identificerede genmarkører i tumorer.

12-gen signatur adskilt høj og lav risikogrupper fra patienter som ikke fik kemoterapi (log-rank

P

0,05) i følgende årgange: (A) fase i-patienter fra uddannelsen kohorte, (B) fase i-patienter fra to test kohorter, (C) stadie II patienter fra uddannelsen kohorte, (D) fase II patienter fra de to test kohorter.

Prognose evaluering af 12- gen signatur med kliniske kovariater

for at bekræfte prognostiske magt identificerede 12-gen-signatur, blev udtrykket defineret prognostisk model evalueret med almindeligt anvendte prognostiske faktorer af lungekræft, herunder køn, alder, og tumor etape på de kombinerede test kohorter (DFCI og MSK). Den posteriore sandsynlighed for høj risiko, betegnes som 12-gen score risiko, blev anvendt som en covariat i den multivariate Cox-analyse (tabel 3). Uden 12-genet score risiko, tumor etape var den eneste faktor signifikant (

P

0,00006) forbundet med forhøjet risiko for lungekræft død. Når 12-genet risikoscore blev tilsat til den multivariate Cox model, 12-genet risikoscore viste en stærk association med overlevelse lungecancer (hazard ratio = 3,94, 95% CI: [2,07, 7,52]), og tumor stadium forblev signifikant (tabel 3). Ligeledes blev en omfattende evaluering med alle tilgængelige kliniske kovariater og demografiske data i datasættet, herunder rygevaner, race, og tumor differentiering (tabel 4). I denne omfattende evaluering, den 12-genet risikoscore forblev en meget væsentlig prognostisk faktor med en hazard ratio på 4,19 (95% CI: [2,08, 8,46]). I begge multivariate analyser, var hazard ratio for 12-genet risikoscore algoritme var højere end andre kliniske kovarianter undtagen tumor stadie (III vs. I), mens der ikke er nogen signifikant forskel mellem hazard ratio på 12-genet underskrift og tumor scene. Disse resultater viser, at 12-genet signatur er en mere præcis prognostisk faktor end nogle almindeligt anvendte kliniske parametre.

Sammenligning med andre lungekræft gen signaturer

I undersøgelsen af Shedden et al. [19], prognostiske klassificører blev konstrueret med genekspression underskrifter alene eller genekspression signaturer kombineret med kliniske kovariater. Blandt tolv gen signaturer identificeret i deres undersøgelse (tabel S7), blev den bedste signatur rapporteret som “metode A” (kaldet “Shedden A” i denne undersøgelse), som indeholder omkring 9591 gener /prober. For at kunne sammenligne den intelligente ydeevne vores prognostisk model med deres bedste model, er den anslåede hazard ratio og konkordansen sandsynlighed estimat (CPE) af de modeller evalueret. Hazard ratio større end 1 indikerer, at patienter med høje forudsagte risiko score har dårlig klinisk resultat. Modellen har en stærk forudsigelseskraft hvis CPE værdi tæt på 1; CPE værdi tæt på 0,5 angiver, at modellen har dårlig forudsigelseskraft (sammenligneligt med tilfældig forudsigelse). Resultater viser, at den foreslåede 12-genet signatur har den højeste hazard ratio og CPE i begge testsæt sammenlignet til genet signaturer fra Shedden et al. [19] (figur 5).

For at evaluere 12-gen signatur med tidligere publicerede 14 lungekræft signaturer [12], [13], [16] -. [19], [22 ] – [25] (tabel S6), Gene Set Enrichment Analysis (GSEA) blev anvendt til at vurdere berigelsen af ​​disse underskrifter på 5-års overlevelsen. Den normaliserede berigelse score (

NES

) og dets tilsvarende falsk opdagelse sats (

FDR

) tilknyttet hvert gen signatur blev vurderet på alle 442 prøver anvendt i denne undersøgelse. Generelt et gen sæt med høj

NES

og lav

FDR

ønskes, da den viser, at genet sæt udtrykker forskelligt i forhold til det kliniske resultat og den konstatering næppe være af chance. I forhold til 14 andre offentliggjorte gen signaturer, den 12-genet signatur udviser høj berigelse patientgruppe hvis overlevelse er længere end 5 år med markant lav

FDR

(absolut

NES

= 1,5;

FDR

. 0,10) (fig S1). I denne analyse, den mest beriget signatur med den laveste

FDR

var SHEDDEN_MH af 244 gener (absolut

NES

= 2.00;

FDR

0,002). Samlet set blandt de 15 gensæt studeret, 12-genet signatur er en af ​​de bedste lungekræft signaturer evalueret med GSEA.

RT-PCR Validering af genekspressionsmønstre

For yderligere at bekræfte ekspressionsmønstre for de identificerede 12-generne, blev RT-PCR mikrofluid med lav densitet arrays anvendes til at analysere uafhængige NSCLC tumorprøver. Først blev 12-genekspressionsmønstre opnået fra både microarray og RT-PCR sammenlignet med hensyn lymfeknudemetastaser (fig. 6A). På RT-PCR-data normaliseret med

POLR2A

, genekspression fold ændringer i de 12 gener i lymfeknude positive (LN +) versus lymfeknude negative (LN-) prøver blev sammenlignet med dem i microarray data fra Shedden et al [19]. Resultaterne viser, at mRNA ekspressionsmønstre for den 12-genet signatur målt i begge platforme er samstemmende med hensyn til lymfeknudemetastaser. Så, for at bekræfte genekspression mønstre i form af samlet overlevelse, fold ændringer mellem lav risiko (live efter 3 år) og høj-risiko (død inden for 3 år) grupper blev også sammenlignet (fig. 6C). Tre års overlevelse blev brugt til at holde balancen i høj risiko (

n

= 11) og lav-risiko (

n

= 12) grupper i RT-PCR-kohorten. Alle genmarkører udstillet konsistente ekspressionsmønstre i løbet overlevelse undtagen

XPO1

i begge platforme.

Genekspression fold ændring i lymfeknude positive (LN +) patienter vs. lymfeknude negativ (LN-) patienter blev sammenlignet (A). Prøver, der indgår i folden sammenligning ændring blev sammenfattet i (B). Genekspression fold ændring i høj risiko (død inden for 3-y) vs. lav risiko (live efter 3-y) grupper blev også sammenlignet på patienter med opfølgende oplysninger (C). RT-PCR-data blev normaliseret med POLR2A i en prøve-wise måde. Mikromatrice data blev opnået fra Shedden et al [19]. En stjerne (*) blev sat over en bar, hvis det gen viste signifikant forskellen udtryk i

t

-tests (

P

0,05).

Prediction af chemoresponse i NCI-60 cellelinjer

Efter underbygge den kliniske relevans af de 12-genet signatur forudsige lunge adenocarcinom samlet overlevelse, vi søgte at undersøge, om signaturen kan forudsige chemoresponse til anti-lungecancer agenter, herunder Cisplatin, carboplatin, paclitaxel, etoposid, Erlotinib og Gefitinib. Her har de NCI-60 cellelinjer, uanset vævsoprindelse, blev anvendt i undersøgelsen. For hvert lægemiddel blev cancercellelinier, der enten følsomme eller resistente over for lægemidlet inkluderet for at opbygge en chemoresponse klassifikator baseret på 12-genekspressionsprofiler i cellelinierne. Udførelsen af ​​klassificører blev evalueret med leave-one-out cross validering (tabel 5). Statistisk signifikans af klassificeringen blev evalueret ved at sammenligne den samlede nøjagtighed af 12-genet signatur med den for 1000 tilfældige signaturer af samme størrelse ved hjælp af den samme algoritme. Den samlede forudsigelse nøjagtighed chemoresponse var 81% (

P

0,004) for Paclitaxel (Taxol), 78% (

P

0,001) for carboplatin, 80% (

P

0,005) for cisplatin, 73% (

P

0,017) for etoposid, 79% (

P

0,001) for Erlotinib, og 94% (

P

0,001) for Gefitinib. Disse resultater viser, at 12-genet signatur forudsiges nøjagtigt følsomhed og modstandsdygtighed over for fælles lungekræft kemoterapeutiske midler i cancercellelinjer.

Den differentielle ekspression i følsomme og resistente lungekræft cellelinier blev analyseret for hver signatur gen. Det stof Svarene fra de lungekræft cellelinjer i NCI-60 panel blev leveret i tabel S8. Blandt signatur gener, den overekspression af

STK24

var knyttet til kemoresistens til alle de undersøgte stoffer undtagen Gefitinib i lungekræft-cellelinjer; mens overekspression af

FAM14A

var forbundet med kemosensitivitet til alle de undersøgte stoffer undtagen Gefitinib i lungekræft-cellelinjer. Det under-udtryk for

STK24

var forbundet med resistens over for Gefitinib (

P

0,05). Det under-udtryk for

CCDC99

blev observeret i resistens mod Paclitaxel (

P

0,05). Den overekspression af

DLC1

var forbundet med kemoresistens til Erlotinib (

P

0,05), Paclitaxel, og Cisplatin; mens dets under-udtryk var forbundet med kemoresistens til Etoposid og Carboplatin (ikke statistisk signifikant)

I grafen, differential udtryk med statistisk signifikans (

P

. 0,05 ,

t

-tests) er markeret med en rød stjerne.

EGFR

mutation er en velkendt faktor i narkotika reaktion på Gefitinib og Erlotinib. I de NCI-60 cellelinjer,

EGFR

mutation blev kun detekteret i SK-MEL-28 melanom og RPMI-8226 myelomlinier, men ikke i nogen lungekræft cellelinier [26]. Vi analyserede rå ekspressionsniveauerne af

EGFR

probe sæt. Konkret en fold ændring på 1,76 overekspression af

EGFR

(210984_x_at) blev observeret i Erlotinib resistente vs. følsomme lungekræft cellelinier (

P

0,05), mens ingen signifikant differentiale udtryk for

EGFR

blev observeret i andre undersøgelser lægemidler (resultater ikke vist). I den samlede patientpopulation kohorter (

n

= 442) fra Shedden et al [19],

EGFR

udtryk var ikke signifikant associeret med lungekræft overlevelsen i univariate Cox modellering.

funktionel pathway analyse

Efter at have konstateret den kliniske relevans af de 12-genet prognostisk signatur, vi søgte at udforske den funktionelle inddragelse af dette gen sat i lunge tumorigenese og tumor progression. To funktionelle pathway analyseværktøjer, Ingenuity Pathway Analysis (IPA) og Pathway Studio 7,0, blev anvendt til opnåelse curated molekylære interaktioner forbundet med de 12 gener. Resultater fra IPA viser, at signatur gener interagerer med store kræft signalveje, såsom

TNF

AKT

(Fig. 8A). Pathway Studio 7.0 blev brugt til at finde interaktioner blandt de 12 gener og 13 større lungekræft kendetegnende (

EGF

,

EGFR

,

KRAS

,

MET

,

RB1 ​​

,

TP53

,

E2F1

,

E2F2

,

E2F3

,

E2F4

,

E2F5

,

Akt1

, og

TNF

) rapporteret i litteraturen. Pathway Studio afslørede forskellige typer af interaktioner spænder fra regulering til protein modifikation blandt de 12 gener og otte ud af 13 kræft kendetegnene (fig. 8B). Den funktionelle vej analyse viser, at de 12 signatur gener er involveret i lungekræft onkogenese og tumorprogression.

(A) Brug kerne analyse fra Ingenuity Pathway Analysis (IPA) blev kuraterede interaktioner afsløret blandt de identificerede signatur gener og større lungekræft signalveje. (B) Seks af de 12 signatur generne udstillet også forskellige curated interaktioner med otte fremtrædende lungekræft kendetegnende med Pathway Studio 7.0.

Diskussion

Lungekræft er stadig den hyppigste dødsårsag på verdensplan . Det er vigtigt at identificere klinisk relevante prognostiske biomarkører til at udvikle personlig behandling. Endnu vigtigere er, kan de fundne biomarkører afslører fundamentale molekylære mekanismer i denne dødelige sygdom, og øge vores forståelse af, hvorfor patienter med visse tumor molekylære karakteristika har en dårlig klinisk resultat, og hvordan deres resultat kan forbedres.

Denne undersøgelse gaver en hybrid model system til identificering af en 12-gen signatur for lungekræft prognose og chemoresponse forudsigelse. Den 12-genet signatur kvantificerer nøjagtigt overlevelse hos patienter med resektabel lungeadenocarcinom og skaber betydelig prognostisk kategorisering inden trin I og IB patienterne. Denne signatur pålidelig identificeret højrisiko patienter inden for fase I og II, som ikke fik kemoterapi. Genekspressionen definerede risiko score er en mere præcis prognostisk faktor end almindeligt anvendte kliniske parametre. Denne prognostisk signatur forudsiger også kemoresistens og kemosensitivitet til flere store anti-lunge cancer medicin i NCI-60 cancer cellelinjer. Tilsammen indikerer resultaterne, at den 12-genet signatur kan anvendes til at vælge det tidlige stadie lungeadenokarcinom patienter med høj risiko for tumortilbagevenden for adjuvans kemoterapi. I mellemtiden kan det spare trin I og II lavrisiko-patienter fra unødvendig kemoterapi. Endvidere 12-genet signatur har potentialet til at blive anvendt til at informere læger som anticancerlægemidler bør anvendes i behandling af en bestemt patient. De ekspressionsmønstre for den 12-genet signatur blev bekræftet i RT-PCR. Kuraterede interaktioner mellem signatur gener og store kræft signalering kendetegnende afsløret i den funktionelle pathway analyse giver yderligere beviser for, at 12-genet signatur kan være involveret i lungekræft onkogenese og tumorprogression.

I den post-genome æra, innovative beregningsmodeller er nødvendige for at identificere klinisk vigtige sygdomsmarkører. I betragtning af den nuværende omfanget af høje gennemløb data, er der behov for en kombinatorisk gen valg ordning på forskellige stadier af gen-filtrering.

Be the first to comment

Leave a Reply