PLoS ONE: Predictive Gener i tilstødende Normal Tissue der fortrinsvis Altered af sCNV under tumorigenese i leverkræft og maj hastighedsbegrænsende

Abstrakt

Baggrund

I hepatocellulært carcinom (HCC) gener prædiktive for overlevelse er blevet fundet i både tilstødende normal (AN) og tumor (TU) væv. Forholdet mellem disse to sæt af prædiktive gener og den generelle proces med tumorigenese og sygdomsprogression er fortsat uklart.

Metodologi /vigtigste resultater

Her har vi undersøgt HCC tumorigenese ved at sammenligne genekspression, DNA-kopi nummer variation og overlevelse ved hjælp -250 AN og TU prøver, der repræsenterer henholdsvis præ-kræft stat, og resultatet af tumorigenese. Gener, der deltager i tumorigenese blev defineret ved hjælp af en gen-gen korrelation metaanalyse procedure, at sammenlignet AN versus TU væv. Gener prædiktive af overlevelse i en (AN-overlevelse gener) viste sig at være beriget i differential gen-gen korrelation gensæt angiver, at de deltager direkte i tumorigeneseprocessen. Derudover de AN-overlevelse gener var for det meste ikke prædiktiv efter tumorigenese i TU væv og denne overgang var forbundet med og kunne stort set forklares ved effekten af ​​somatiske DNA-kopi nummer variation (sCNV) i cis og trans. Den data var i overensstemmelse med variansen af ​​AN-overlevelse gener bliver hastighedsbegrænsende trin i tumorigenese og dette blev bekræftet ved anvendelse af en behandling, der fremmer HCC tumorigenese der selektivt ændret AN-overlevelse gener og gener differentielt korrelerede mellem AN og TU.

konklusioner /Signifikans

Dette antyder, at processen for tumor evolution involverer hastighedsbegrænsende trin i forbindelse med baggrunden, hvorfra tumoren udviklet hvor disse var ofte indikerer klinisk resultat. Derudover behandlinger, der ændrer sandsynligheden for tumorigenese forekommende kan virke ved at ændre AN-overlevelse gener, hvilket antyder, at processen kan manipuleres. Yderligere sCNV forklarer en væsentlig del af tumor specifikke udtryk og kan derfor være en kausal drivkraft for tumor udvikling i HCC og måske mange solide tumorer typer

Henvisning:. Lamb JR, Zhang C, Xie T, Wang K, Zhang B, Hao K, et al. (2011) Predictive Gener i tilstødende Normal Tissue der fortrinsvis Altered af sCNV under tumorigenese i leverkræft og maj hastighedsbegrænsende. PLoS ONE 6 (7): e20090. doi: 10,1371 /journal.pone.0020090

Redaktør: Xin Wei Wang, National Cancer Institute, USA

Modtaget: August 31, 2010; Accepteret dateret 25. april 2011; Udgivet: 5 jul 2011

Copyright: © 2011 Lamb et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev helt finansieret af Merck Co og dets helejede datterselskab Rosetta Inpharmatics, Inc. Mange af forfatterne var eller er Merck medarbejdere. Manuskriptet blev revideret af Merck og godkendt til overgang til det offentlige rum uden ændringer. Andre end denne Rosetta Inpharmatics og Merck havde ingen rolle i studie design, dataindsamling og analyse, eller forberedelse af manuskriptet

Konkurrerende interesser:. JRL, CZ, TX, KW, BZ, KH, EF, HF, JM, MF, CS, II, ZZ, JB, RS, GD, MC, JD, CM, VE, JZ, MM, HD og ES var alle Merck medarbejdere på Rosetta stedet; MS, OP, DB, AL, JW, CB-D, SF og PS var Merck medarbejdere på andre sites; RP, CY, NL og JML var ansat i Hong Kong University. Andre end at finansiere denne undersøgelse og ansættelse af forfattere, som beskrevet ovenfor, er der ingen andre konkurrerende økonomiske eller andre interesser, der skal erklæres. Ovenstående overbevisninger ændrer ikke forfatternes tilslutning til alle de PLoS ONE politikker på datadeling og materialer.

Introduktion

En universel træk af kræftceller er genomisk ustabilitet [1], [2 ], [3], [4], [5], som menes at være forpligtet til at generere tilstrækkelig variation hvorfra fordelagtige ændringer for tumorvækst og overlevelse er valgt [6]. Efter dette paradigme, er det nu klart, at genomisk ustabilitet kan opstå fejl i DNA-syntese og reparation, kromosom adskillelse, checkpoints, telomer tab og andre biologiske processer, der resulterer i punktmutationer, kopiere nummer variation og gevinst /tab af biologiske funktioner [2 ], [3], [4], [7], [8], [9], [10]. Hepatocellulært carcinom (HCC) er den anden mest udbredte kræft i asiatiske befolkninger og den tredje hyppigste årsag til kræft dødsfald i verden. Øjeblikket den eneste effektive behandling mulighed er kirurgi [11]. HCC almindeligvis opstår i patienter med viral hepatitis og /eller cirrose, hvor omfattende inflammation udsætter hepatocytter til mitogene stimuli [11]. Den præ-neoplastisk fase er karakteriseret ved en række ændringer, herunder fremkomsten af ​​telomer afkortning og fremkomsten af ​​genomiske forandringer [12]. Strukturelle ændringer i genomet gradvist ophobes under overgangen til neoplasi og fra tidligt til sent HCC [11]. Genomiske ændringer i HCC er heterogene idet mange loci er blevet rapporteret at blive ændret, men generelt ved en lav forekomst [12]. Dette fører til den hypotese, at der er alternative forstyrrelser, der fremmer tumorigenese i HCC [11], [12].

Integrative genomforskning analyse er blevet anvendt på mange ikke-kræftsygdomme [13], [14] og har beskrevet netværk af gen-variation ved at teste alle mulige foreninger på tværs af forskellige befolkningsgrupper segregerende sygdommen af ​​interesse. Dette arbejde har fastslået, at gener er generelt en del af sammenhængende netværk, og at de væsentligste sammenslutninger af gener til sygdom opstår ofte i forbindelse med netværk subregioner hvor mange eller alle medlemmer af disse under-net er forbundet med hinanden og med sygdom træk [13], [15], [16]. Sådanne undergrupper netværk har yderligere været forbundet med DNA variation og valideret som kausalt kørsel sygdom resultat [13].

Her har vi undersøgt gen netværksstruktur ved hjælp af en samling af -250 matchede tumor (TU) og tilstødende normale ( AN) prøver fjernet fra HCC patienter under kirurgisk resektion og har vurderet, om disse netværk er forbundet med DNA og sygdom variation i HCC kohorte. Den fremgangsmåde var i det væsentlige at afdække samspillet i og mellem datatyper målt i denne population (DNA, udtryk, overlevelse) i AN og TU væv i en tidsubegrænset, omfattende og fuldstændig drevet data måde. Interaktionerne karakteristiske for tumorer (TU) blev sammenlignet med den normale (AN) væv at afsløre tumorspecifikke ændringer. Her præsenterer vi resultaterne af denne omfattende analyse og vise, at sCNV håndfast ændrer ekspressionen af ​​et stort antal gener, og også forholdet mellem disse gener til overlevelse i enten en eller TU væv, og det tumorigenese stort set involverer forstyrrelse af normale funktioner og aktivering af et mindre sæt funktioner, som kan være kritisk for sygdommens progression. Dataene antydede, at gener prædiktive af overlevelse i en væv kan være hastighedsbegrænsende trin for tumorigenese. I overensstemmelse med denne hypotese en behandling, der fremkalder HCC tumorigenese i mus, MET onkogen overekspression, blev fundet til selektivt at ændre ekspressionen af ​​gener prædiktive for at overleve i AN væv af mennesker.

Resultater

For at karakterisere gen netværk i human lever tumor og tilstødende normale væv vi samlet en vævsspecifik kohorte bestående af lever tumor (TU) og tilstødende normale (AN) væv fra 272 asiatiske patienter (herunder 151 parrede TU og AN prøver, supplerende tabel S1 [17]) gennemgår kirurgisk resektion til behandling af HCC. RNA blev isoleret fra alle TU og AN prøver og profileret på en brugerdefineret Affymetrix microarray består af oligonucleotidprober rettet udskrifter repræsenterer 37,585 kendte og forudsagte gener, herunder high-tillid ikke-kodende RNA-sekvenser. DNA blev isoleret fra alle AN og TU væv og genotypebestemmes på Illumina 650Y SNP genotypning array. Kopiér nummer aberration markører (sCNV markører) blev derefter tilregnes for 32,711 steder i genomet fra denne high-density SNP panel (metoder).

Gene netværk i levertumor og tilstødende normale prøver

I betragtning af de storstilede genomiske forandringer generelt vides at forekomme i tumorprøver, vores observation af store udtryk forskelle mellem AN og TU prøver i HCC kohorte var ikke overraskende, med 28.233 ( 75%) af de 37,585 gener er repræsenteret i mikroarray anvendt i denne undersøgelse påvist som differentielt udtrykt (p 0,05, FDR 0,07, se tabel S2), i overensstemmelse med tidligere rapporter [18]. Det største problem, så at fortolke molekylære tilstandsændringer mellem AN og TU er at skelne mellem de ændringer, der er relevante for udviklingen af ​​tumoren fra disse ændringer, der er simpelthen sporing med de genomiske ændringer, men ikke er relevante for tumor biologi. Derfor søgte vi at karakterisere virkningen disse omfattende ændringer havde på konnektivitet struktur vævsspecifikke gen-netværk, der giver en vej til at identificere de ændringer, der fører til ændringer i de molekylære netværk, der definerer de biologiske processer, der udføres af væv.

for at karakterisere ændringer mellem AN og TU-netværk, vi brugte en meta-analyse procedure [19], [20] for at teste, om omfanget af association mellem to givne gener i en væv var signifikant forskellig fra foreningen observeret for det samme par i det andet væv (Methods). Signifikant sammenhæng forskelle indikerer tilstedeværelsen af ​​tilslutningsmuligheder forskelle mellem AN og TU-netværk (Figur 1). Ved en Bonferroni justeret, differential-forbindelse p = 7e-11 ( 1% familie-wise fejlrate), vi identificeret 1,156,638 forskelligt korrelerede par (kun 2 ville have forventet tilfældigt), eller omkring 12% af 9.976.814 korrelerede genpar findes i enten AN eller TU væv. Vi har også empirisk estimeret den differentielle tilslutning null distribution og observeret nogen differentielt forbundne par med P 7e-11 (figur 1), hvilket antyder, at denne grad af forskellen tilslutning er yderst signifikant

A Vist er antallet af det differentielt. korrelerede gener opdaget ved hjælp af en meta-analyse procedure (metoder) mellem AN og TU væv. Til sammenligning den samme analyse blev kørt både i den virkelige data og i permutation af AN og TU opgaver. Toppanelet viser antallet af forskellen genpar (Y-akse) for de egentlige data (AN vs TU, med blåt) i sammenligning med permutation (rød) som en funktion af p-værdi (vist som negative log10 [P] , på X-aksen). Antallet af differentielt forbundne gener (midterste panel) og falsk opdagelse satser (nederste panel) er også vist. B At fastslå, at de forskelligt korrelerede genpar skyldes forskellen mellem AN og TU væv og ikke for eksempel forskelle mellem individer blev kørt den samme analyse ved hjælp AN vs ET i forhold til AN vs TU bruger det samme antal prøver (metoder). Toppanelet viser antallet af forskellen genpar (y-akse) for både AN vs TU (blå) og AN vs AN (rød) som en funktion af p-værdi (vist som negative log10 [P], på X- akse). Antallet af differentielt forbundne gener (midterste panel) og falske opdagelse satser (nederste panel) er også vist.

For at øge tilliden til, at genpar identificeret som forskelligt korreleret mellem AN og TU-netværk afspejles biologisk relevant ændringer i netværk stater relateret til tumorigenese og tumor progression, begrænsede vi vægt på de forskelligt korrelerede genpar, der var højst usandsynligt at have fundet sted ved en tilfældighed (p 1e-19, med en gennemsnitlig ændring i Spearman korrelationskoefficienten mellem væv af 0,73; nej genpar observeret i de permuteret data, FDR 1e-6, se figur 1). På denne strenge cut-off, vi identificeret 49,300 genpar dækker 8,736 gener, hvis forholdet afveg betydeligt mellem TU og AN væv. Af de 49,300 differentielt forbundne par identificeret, blev 42.179 (86%) stærkt korreleret i AN væv, men signifikant mindre korrelerede i TU væv, mens kun 7.121 par (14%) havde stærkere korrelationer i TU versus AN prøver, hvilket indikerer, at netværket forandringer i tumoren var mere tilbøjelige til at ødelægge i stedet skabe stærke associationer mellem udtryk træk.

for at skelne mellem de typer af gener involveret i differentierede forbindelser, vi definerede gevinst på konnektivitet (GOC) gener som dem i som mere end 90% af deres differentierede interaktioner afspejlede korrelationer, der var stærkere i TU forhold til AN. Ligeledes vi definerede tab af tilslutningsmuligheder (LOC) gener som dem, hvor mere end 90% af deres differentierede interaktioner afspejlede korrelationer, der var svagere i TU forhold til AN (supplerende tabel S2). Selv om disse er vilkårlige cut-offs, de tjener til at fremhæve den relative fordeling af gevinst og tab af tilslutningsmuligheder forbundet med tumorigenese, givet mere end 80% af de differentielt forbundne gener falder i en af ​​de to kategorier. Under denne kategorisering var der 6,053 LOC gener og kun 1020 GOC gener. GO berigelse analyse efter Bonferroni korrektion for antallet af kategorier afslørede, at GOC gener blev beriget i cellecyklus (3,93-gange beriget, p = 1.6e-20) og relaterede processer (f.eks kromosomsegregering, DNA-replikation, og spindel organisation) , mens LOC generne meste blev beriget for metaboliske processer (1,11 gange beriget, p = 1.4e-20), specielt i forbindelse med mitokondrier (1,56-fold beriget, p = 1.5E-20). Disse resultater antyder, at processen med tumorigenese er i høj grad en af ​​forstyrrelse af normale net (LOC), og i mindre grad en af ​​skabelsen af ​​nye netværk (GOC). I overensstemmelse hermed blev LOC begivenheder beriget for normal leverfunktion gener, hvor som GOC hændelser blev beriget for gener involveret i kræft vækst af cellen. GOC begivenheder, selv om mindre i antal, kan repræsentere tumor specifikke funktioner, der kræves for sygdomsprogression og som sådan kan være en interessant kilde til mål for HCC. For at illustrere arten af ​​de differentielle forbindelser top 5 generne og de gener, hvortil de blev differentielt forbundne, er vist i Figur 2. Eksempler på individuelle genpar, der var differentielt forbundet i TU eller væv er vist i figur 3, herunder inhibitoren G1 til S faseovergang (CDKN2C med tab af tilslutningsmuligheder) og DNA replikation licenser faktor (CDT1 viser gevinst på konnektivitet).

de øverste 5 differentielt forbundne gener og deres varierende forbundne partnere vises. Hvert gen er repræsenteret ved en blå ovale og top 5 er angivet med kasserne. For hver af de top 5 gener også angivet, er antallet af differentierede korrelationer mellem AN og TU i alt (DiffConn) og tallene for gevinst (GOC) og tab (LOC) i sammenhæng i hvert enkelt tilfælde. Linjer forbinder gener viser, at denne par forskelligt var korreleret mellem AN og TU hvor både LOC (blå linjer) og GOC (røde linjer) er angivet. Differential forbindelser mellem de øverste 5 gener og enhver anden gen er vist, samt differentielle korrelationer mellem gener differentielt forbundet med toppen 5. De øverste 5 gener blev fundet at være differentielt korreleret til en yderst overlappende sæt af partnere. Vist i indsatsen tabellen (øverst til højre) er den Fishers Exact Test p værdi for overlap mellem forskelligt korrelerede gen partnere for hver af de top 5 gener (nederst til venstre på bordet). Også vist (øverst til højre) er den fold berigelse for overlapninger i forhold til hvad man kunne forvente ved en tilfældighed. Som vist et indviklet net af differentierede korrelationer som følge af tumorigenese er afsløret

For at illustrere både tab og gevinst på korrelation to cellecyklus gener blev valgt som har mange differentierede tilslutninger:. Den cyklin afhængige kinase inhibitor CDKN2C ( A, 149 tab og 11 gevinster på konnektivitet) og kromatin licenser og DNA-replikation faktor CDT1 (B, 0 tab og 38 gevinster på konnektivitet). Expression intensitetsværdier for CDNK2C (X-aksen) og DCN (Y-akse) er vist (A) i AN (blå, cc 0,548, p = 2e-20) og TU væv (rød, cc -0,358, p = 7,14 e-10). Intensitetsværdierne for CDT1 (X-aksen) og MCM3 (Y-akse) er vist (B) i et (blå, cc-0,153, p = 0,0166) og TU væv (rød, cc 0,673, p = 3.05e-38 ). Vist i C er graden fordeling for de 8,736 differentielt forbundne gener som beskrevet i teksten. Antallet af differentierede forbindelser for hvert gen (log10, X-aksen) blev sammenlignet med count (log10, Y-akse). Som vist fordelingen var skalafrie, hvilket indikerer, at de identificerede gener tendens til fortrinsvis at binde sig til en lille antal hub gener i enten tumor- eller tilgrænsende normale væv, men ikke i begge.

For at vurdere, om den differentierede korrelationer blev tilfældigt fordelt blandt de signifikante gen-gen korrelationer eller om der var nogle højere niveau struktur, undersøgte vi fordelingen af ​​antallet af differentierede korrelationer for hvert gen. Vi observerede, at mens de fleste gener deltog i et lille antal differentierede korrelationer, der var en undergruppe af gener, der deltog i mange differential korrelationer. Faktisk den differentierede korrelationer tæt fulgt en magt lov fordeling, der var helt anderledes end hvad man kunne forvente ved et tilfælde (se figur 3). Dette indikerer, at visse gener repræsenterer hub knuder i forskelligt tilsluttede matrix, der opstod fra tumorigenese og som sådan kan være af særlig betydning.

sCNV forklarer en stor del af TU udtryk variation

I betragtning af den store skala ændringer i udtryk og korrelationsstrukturer opstod under processen med tumorigenese, søgte vi at identificere de kausale førere af disse ændringer. Somatisk kopiantal variation er et fælles træk ved mange faste tumortyper og er blevet forbundet med den aggressive sygdom. For HCC især sCNV er blevet observeret i de tidligste stadier af sygdommen og stigninger i forekomsten med sygdomsprogression [11]. Vi vurderede derfor udbredelsen af ​​sCNV i HCC og i hvilket omfang det var forbundet med gen variation i TU væv.

DNA variation blev vurderet i AN og TU prøver ved hjælp af Illumina high-density SNP microarrays. sCNV blev estimeret ved anvendelse glattede logR forholdet er af tilstødende markører på 32.711 jævnt fordelt loci gennem genom (Methods). I TU prøver tegn på hyppig forstærkning eller sletning involverer store genomiske regioner blev set (figur 4). I modsætning blev observeret meget få sådanne begivenheder i AN prøverne med denne analyse (4 AN prøver viste sig at have begrænset evidens for kopi nummer variation). sCNV variation blev sammenlignet med gen-variation i både AN og TU prøver.

Vist er en varme kort over kopi nummer afvigelser (sCNV) for tumor afledte prøver (Y akse) grupperet af K betyder i 10 grupper, versus de lineære positioner gennem kromosom 1 (X-aksen). sCNV blev anslået som beskrevet i metoder og angives som et kontinuum af farve fra rød (forstærkning) til sort (ingen ændring) til grøn (tekst udgår). En skala for sCNV data indikeres på højre side af varme-kortet (logR forhold fra 1 til -1). Som det kan ses de fleste af aberrationer syntes at inddrage store kromosomale afsnit om omfanget af hele kromosom arme.

I overensstemmelse med tidligere undersøgelser af andre typer kræft og stråling hybrider [4], [21], [22], [23], stærke positive korrelationer mellem gener og sCNV markører blev identificeret i de tilfælde, hvor de tilsvarende gener overlappede eller var nær sCNV markør, der testes, er nævnt her som cis-virkende foreninger (figur 5A og tabel S2). Den mest sandsynlige forklaring på denne observation i TU væv er, at sCNV inducerer proportionale ændringer i gener, der var proximal til stedet for at sCNV. I modsætning var der ingen cis-virkende sammenhænge mellem AN CNV markører og AN gener ud over hvad man kunne forvente ved en tilfældighed, hvilket indikerer, at cis-korrelationer mellem sCNV og udtryk var tumor specifikke. I betragtning af dette korrelationer at kopiere nummer variation kun blev undersøgt ved anvendelse af TU væv.

Fordeling af korrelationer (X-akser) mellem gener (Y-akser) og den nærmeste sCNV markør (i cis) i TU (A) og An (B) væv. Fordelingen af ​​de egentlige data (blå optrukne linjer) blev sammenlignet med permutation af genet til markør-forbindelse (grøn stiplede linjer). Ingen signifikante associationer blev set i en over hvad man kunne forvente ved en tilfældighed. I TU var der en udtalt skævhed til positive korrelationer. C. Fordeling af korrelationer mellem alle gener (Y-aksen) og alle sCNV markører, vist lineært ved kromosom placering gennem genomet (X-aksen). Kromosom grænser er angivet med de lodrette grønne linier og er nummererede. Ved hjælp af en korrelation afskæring af 0,3 (p 4.7e-4, FDR 0,02), optælling af alle gener (ekskl cis gener, grøn), positivt korrelerede trans gener (rød), eller negativt korreleret trans gener (blå) er angivet for hvert markør (trans her blev defineret som gener og sCNV markører falder på separate kromosomer). Adskillige hotspots var synlige ved hvilken mange gener blev forbundet med sCNV på et bestemt locus, især for regioner på kromosom 1, 2, 6, 7, 12, 14 og 20 (se teksten for yderligere diskussion). D. Gener forbundet med sCNV hotspots i HCC og cellelinier væsentligt overlapper hinanden. Hotspot sCNV markører blev udvalgt ved at identificere områder, der er forbundet med 500 gener (Pearson korrelationskoefficient 0,3) og derefter vælge den eneste top markør pr kromosom. Generne er forbundet med hver hotspot markør blev sammenlignet (blå cirkler, størrelse svarende til antallet af gener) og betydelige overlapninger (Fishers eksakte test p 1e-6) er vist som kanterne forbinder par af knuder. En tilsvarende analyse blev udført på en samling af cancercellelinier (CCL, grønne cirkler). I dette tilfælde blev målt et mindre antal af totale gener (23.404 vs 37.585), så en tilsvarende del af de samlede gener ( 370) signifikant associeret med en sCNV markør var påkrævet. Tykkelsen af ​​kanterne forbinder knudepunkterne repræsenterer berigelse af de overlappende gener i sammenligning med den, der forventes ved en tilfældighed (observeret overlapning divideret med forventet berigelse 5 fold – tynd linje, 5 – tykke linjer). Som vist generne forbundet med hotspots blev delt i datasæt. For eksempel generne i HCC knyttet til hotspots i kromosomerne 2, 6, 12, 14 og 20 signifikant overlapper hinanden. Hotspot overlapninger mellem CLL og HCC involverer de samme genomiske regioner er fremhævet med rødt (kromosom 1, 14 og 20).

Mere generelt foreningens test mellem alle TU gener og TU sCNV markører afslørede mange meget signifikant foreninger, der er nævnt her som trans-virkende foreninger (se figur 5C). blev fundet flere genomiske loci at være forbundet med mange flere gener, end man ville forvente ved en tilfældighed, der er nævnt her som hotspot sCNV loci (se figur 5C). Vi identificerede 7 hotspot sCNV loci på 7 forskellige kromosomer, der hver blev forbundet med 500 trans gener (korrelation 0,3; FDR 0,001). De gener associeret med disse hotspots var stærkt overlappende, hvilket antyder, at sCNV på flere loci sideordnet drive netværk af gener (figur 5D og tabel S3). For at vurdere, om disse hotspot loci var specifikke for HCC, vi foretaget en lignende forening analyse mellem sCNV markører og gener i en samling af ~130 kræft cellelinier (CCL) fra flere vævstyper [24] (metoder). Tre af de syv hotspot loci identificeret i HCC data overlapper sCNV hotspots i CCL-data. I alle tre tilfælde blev de samme genomiske steder involveret. Disse data antyder, at sCNV hotspots er ikke unikke for HCC, men i virkeligheden kan forekomme i mange tumortyper og kan involvere lignende par af genomisk loci og gener, måske drivende centrale biologiske processer er kritiske for tumordannelse og progression. I overensstemmelse med dette er det for nylig blevet rapporteret, at strukturen af ​​sCNV ofte er delt på tværs af flere tumortyper [25]. Dette kunne tyde på, at cis- og trans-sammenhænge rapporteret her i HCC og celler i kultur kan være relevante for mange tumorer typer med delt sCNV struktur.

At etablere den procentdel af TU-gen variation forklares ved en kombination af sCNV markører konstruerede vi genetiske modeller under anvendelse af en trinvis regression procedure for hvert gen (Metoder og se tabel S2). Som kontrol vi kørte den samme analyse ved hjælp af de permuteret data, hvor forbindelsen mellem generne og sCNV markører blev randomiseret. Brug af strenge cut-off af absolut korrelation 0,3 (FDR 0,001), mængden af ​​varians forklaret af sCNV var så højt som 80%. Påfaldende, blev mere end 40% af generne, der er repræsenteret på mikroarrays anvendt i denne undersøgelse (15.993 ud af 37.585) signifikant associeret med sCNV markører, hvor den gennemsnitlige varians forklaret blandt disse gener fra de sCNV markører var 21,8%. For 3031 af generne (8,1% af de gener, der er repræsenteret på microarray) er større end 30% af deres varians blev forklaret af sCNV markører (tabel 1 2). Også, mens cis-virkende foreninger forklaret fleste sCNV foreninger, 6,6% af generne (n = 2.490) havde varians forklares ved sCNV markører, der var andre end cis, og en delmængde af gener (7,8%, n = 2.974) blev fundet at have varians forklaret af mere end en og op til fem sCNV markører på forskellige kromosomer. Som vist ovenfor (se figur 5) de fleste af trans gener forbinder med et begrænset antal hotspots tyder på, at variation på disse begrænset antal loci var forårsager en betydelig andel af TU gen variation. Disse genetiske virkninger på tumor genekspression er størrelsesordener større end effekt induceret af germlinie DNA variation.

Differentielt korrelerede gener fortrinsvis forbinder med sCNV markører i TU

At udforske hvorvidt sCNV kørte sammenhængende ændringer i netværk, som til gengæld inducerede fænotypiske ændringer i tumoren, vi testet for relationer mellem sCNV markører og varierende korrelerede gener mellem AN og TU væv. De differentielt korrelerede gener blev signifikant beriget med gener associeret med sCNV markører i cis (2,36-fold beriget; p 1e-300) samt for mængden af ​​varians forklaret (2,12-fold beriget, s 1e-300) og for antallet af markører (1,89 gange beriget, s 1e-300) i regressionsmodellen. Denne berigelse afholdt for GOC gener (cis 1,49 gange beriget, p = 1.03e-11, varians forklaret i regressionsmodel 1,55 gange beriget, p = 3.48e-25, antal markører 1,38 gange beriget, p = 1.04e-18) som samt LOC gener (cis 2,17 gange beriget, s 1e-300, varians forklaret i regressionsmodel 1,91-fold beriget, p = 1.1E-321, antal markører 1,81 gange beriget, p = 2.5e-287). Udseendet af differentierede korrelationer i HCC optrådte derfor i høj grad forklares med effekten af ​​sCNV i TU væv.

Forudsigelse af overlevelse i en og TU væv

Vi næste karakteriseret relevansen af ​​den massive ændringer i gen-net til det kliniske forløb af sygdommen ved at sammenligne de ændringer netværket at den delmængde af gener, der forudsiger overlevelse. Gener prædiktive for overlevelse blev identificeret i AN og TU væv ved hjælp af en Cox regressionsmodel (Methods, se tabel S2). Cirka tre gange så mange prognostiske gener blev fundet i AN (p 0,0112, n = 5387; FDR 0,1) versus TU (p 0,002, n = 1.836; FDR 0,1). Selvom de prædiktive gener i AN og TU overlapper mere end man ville forvente ved en tilfældighed (1,52 fold berigelse, p = 6.8e-19, som repræsenterer 7,4% og 21,8%, henholdsvis af AN og TU prædiktive gener), der var mange tilfælde af gener prædiktive i én væv, men ikke i den anden. For eksempel af de 5,387 gener prædiktive i AN, 4987 (92,6%) ikke var prædiktiv i TU, og de 1.836 TU prædiktive gener, 1436 (78,2%) var ikke prædiktiv i AN, ved hjælp af de ovennævnte kriterier cut-off (se Figur 6A). I begge tilfælde var vores statistiske styrke 45% at detektere gener prædiktive i en væv, der blev identificeret som prædiktiv i andet væv (Metoder), hvilket indikerer, at den minimale overlapning ikke var en konsekvens af lav statistisk styrke.

A . Vist er betydningen af ​​foreningen (som negativ log10 af Cox regression p-værdi) findes mellem alle 37,585 gener i AN (X-akse) og TU (Y-aksen) og overlevelse. Gener fundet at være signifikant associeret med overlevelse (FDR 0,1, Methods) er angivet i EN (grønne prikker), TU (røde prikker) eller begge AN og TU (lilla prikker). Som beskrevet i teksten fleste gener prædiktive i ét væv var ikke prædiktiv i den anden. B. Der er vist en repræsentation af nettet transformationer forbundet med HCC tumorigenese (overgang fra præ-tumor tilstand, øverste boks, til tumoren tilstand, nederste felt), hvor prædiktive gener i AN (grøn) stort set mister deres tilknytning til overlevelse i TU følgende association til ikke-prædiktiv sCNV. I kontrast gener prædiktive for overlevelse i TU (rød) er stort set ikke prædiktive in AN, og blev fortrinsvis forbundet med sCNV markører, der var også forudsigende. Ikke vist er gener forudsigelse i både AN og TU, og gener ikke prædiktiv i begge væv. C. vist skematisk er “Field-effekt” hypotese som foreslået [26] (øverste felt), hvor tilgrænsende normale gener forudsiger patientoverlevelse fordi de afspejler en milieu (felt-effekt), hvor de fremtidige tumorer er mere eller mindre sandsynlighed vil opstå . I denne model de nuværende tumorer ikke har en stor indflydelse på resultatet mens fremtidige tumorer gør. En ændring af denne hypotese foreslås her (nederste boks), hvor de tilstødende normale gener repræsenterer en stat, der direkte påvirkede sandsynligheden for de nuværende tumorer opstår og udvikler. I denne modificerede hypotese overlevelse eller død er medieret af de nuværende tumorer. Se tekst for yderligere diskussion

Gener prædiktive af resultat i AN og TU blev beriget for differentierede korrelationer og association til sCNV markører

Brug af AN generne prædiktive for overlevelse (herefter benævnt AN-overlevelse gener), næsten halvdelen (2646 af 5387, 49%) viste sig at være forskelligt korreleret i overgangen til tumor, hvilket er 2,11 gange større end man ville forvente ved et tilfælde (p 1e-300). AN-overlevelse gener var også mere tilbøjelige til at være korreleret til sCNV i cis (1,36-fold berigelse, p = 1.38e-47), og at have en højere andel af deres varians forklares ved sCNV (1,32-fold berigelse, p = 3.94e-50) og ved et større antal sCNV markører (1,33-fold berigelse, p = 1.09e-53) i regressionsmodellen.

Be the first to comment

Leave a Reply