PLoS ONE: En Minimal Connected Netværk af transkriptionsfaktorer regulerede i humane tumorer og dens anvendelse på Quest for Universal Cancer Biomarkers

​​

Abstrakt

En universel cancer biomarkør kandidat til diagnose er meningen at skelne, inden for et bredt område af tumorer, mellem raske og syge patienter. Nyligt offentliggjorte undersøgelser har udforsket den universelle anvendelighed af visse biomarkører i humane tumorer. I denne undersøgelse præsenterer vi en integrativ tilgang for at søge efter potentielle fælles cancer biomarkører. Brug af TFactS web-værktøj med et katalog over eksperimentelt etablerede gen regler, kunne vi forudsige transkriptionsfaktorer (TFS) reguleres i 305 forskellige humane cancer cellelinjer, der dækker et stort panel af tumortyper. Vi identificerede også kromosomale regioner med betydelige kopi nummer variation (CNV) i disse cellelinjer. Inden for rammerne af TFactS katalog, 88 TF’er hvis aktivitet status blev forklaret af deres gen udtryk og CNVs blev identificeret. Deres minimale tilsluttede netværk (MCN) af protein-protein interaktioner danner en betydelig modul i det menneskelige kurateret TF proteomanalyse. Funktionel analyse af proteinerne indeholdt i denne MCN afslørede berigelse i cancerpatienter veje samt inflammation. De ti mest centrale proteiner i MCN er TF’er at trans-regulerer 157 kendte gener, der koder secernerede og transmembrane proteiner. I offentligt tilgængelige samlinger af genekspression data fra 8,525 patientdata væv, blev 86 gener forskelligt reguleret i kræft sammenlignet med inflammatoriske sygdomme og kontroller. Fra TCGA cancer genekspression datasæt blev 50 gener signifikant associeret til patientoverlevelse i mindst en tumortype. Berigelse analyse viser, at disse gener mekanistisk interagere i almindelige kræftform veje. Blandt disse kræft biomarkør kandidater, der TFRC, MET og VEGFA almindeligt forstærket gener i tumorer og deres kodede proteiner farvet positive i mere end 80% af maligniteter fra offentlige databaser. De er knyttet til angiogenese og hypoxi, som er almindelige i cancer. De kunne være interessant for yderligere undersøgelser i diagnostiske strategier kræft

Henvisning:. Essaghir A, Demoulin J-B (2012) En Minimal Tilsluttet netværk af transkriptionsfaktorer regulerede i humane tumorer og dens anvendelse på Quest for Universal Cancer Biomarkører. PLoS ONE 7 (6): e39666. doi: 10,1371 /journal.pone.0039666

Redaktør: Paolo Provero, universitetet i Torino, Italien

Modtaget: Februar 6, 2012; Accepteret: 25. maj 2012; Udgivet: 25 juni, 2012 |

Copyright: © 2012 Essaghir, Demoulin. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev finansieret af FSR Fellowship fra Université Catholique de Louvain. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Kræft er en multifaktoriel sygdom. Mange kræft typer og stadier er blevet skelnes. Denne kompleksitet gør jagten på “universelle kræft biomarkører” en udfordrende opgave. Men mange undersøgelser separat på forskellige typer cancer rapporteret fælles gener med potentiel biomarkør værdi i behandling eller diagnose [1].

På baggrund af litteraturen gennemgang eller ved hjælp af høj-throughput teknikker nogle forfattere identificeret potentielle biomarkører fælles for flere kræftformer og forsøgte at udvikle strategier til at identificere dem fra patientens kropsvæsker, enten direkte eller indirekte. Blandt disse markører, er telomerase blevet rapporteret som værende stærkt udtrykt i neoplasmer [2]. En platform til at fange cirkulerende tumorceller fra patient blod og måle deres telomeraseaktivitet er blevet foreslået som en cancer diagnostisk værktøj [3]. Desuden har ekstracellulære cAMP-afhængig proteinkinase A (EF-PKA) blevet rapporteret at være en god markør for flere cancertyper [4]. Autoantistoffer mod EF-PKA målt ved ELISA fra patienter sera har vist sig at være meget specifik for kræft [5]. Follikelstimulerende hormon (FSH) receptor blev også rapporteret at blive selektivt udtrykt i en række tumorer [6]. De samme betragtninger gælder også for en cytochrom P450 (CYP1B1) [7]. Epigenetiske ændringer, ud over, kunne have en diagnostisk værdi i kræft. Faktisk har nogle forfattere peget på cancer-specifik DNA methyleringsmønstre som markør for maligne sygdomme [8]. De kan påvises på cellefri cirkulerende DNA i blodet [9]. Autoantistoffer mod leukocyt antigen F (HLA-F) blev også påvist hos patienter med forskellige cancertyper sammenlignet med raske individer [10].

Cancer biomarkør kandidatgener kunne identificeres fra litteraturen. Confidence vægte kan tilknyttes hvert gen ved hjælp af sin citation frekvens [11]. Selvom oprindeligt brugt til at optælle markører specifikke for hver kræft type, kan disse vægtede lister hjælpe vælge fælles biomarkører i kræft. Imidlertid har flere udarbejdet strategier blevet brugt til at identificere fælles kræft biomarkører, herunder genekspression metaanalyse på tværs af forskellige tumortyper [12], [13]. De kan være forbundet med funktion og sti anmærkning berigelse filtre at vælge fælles biomarkører [14].

I denne undersøgelse har vi udarbejdet en integrativ strategi at søge efter brugbare biomarkører fælles for kræftformer. Vores arbejdshypotese er baseret på den antagelse, at næsten alle de forstyrrelser, der fører til malignitet transformation af normale celler, selv om komplekse og forskelligartede, deler fælles kollaborative veje [15]. Generelt kan disse veje ender ved at aktivere og /eller undertrykke nogle sæt af gener. Disse gener er mål for transkriptionsfaktorer (TFS). Nogle af disse TF’er er redundant moduleres mellem forskellige celle omdanne hændelser [16] – [22]. De kan ses som tilslutninger eller cross-talk knudepunkter kræft førende veje [23] – [27]. Således bør der være et sæt af minimal tilsluttede TF’er almindeligt forstyrres i tumorer, da de har modulerede pathways [28]. Dette sæt af TF’er kunne betragtes som en flaskehals af kræft pathways. Hvis der findes fælles kræft biomarkører, er de mere tilbøjelige til at være blandt de mål for disse almindeligt regulerede TF’er [29]. I denne undersøgelse, tog vi fordel af TFactS, et værktøj, som vi for nylig udviklet til at forudsige TF regler fra high throughput genekspression data [30].

Resultater

Identifikation af TF’er Reguleret i Cancer Cell linjer

Genekspression og SNP data var tilgængelige for 305 cellelinjer, hvorfra resultater blev yderligere analyseret. Disse cellelinjer repræsenterer et bredt panel af cancertyper, der dækker 28 forskellige histologiske sites.

Vi antog, at vigtige TF’er ville være dem, for hvilke genekspression og CNV kunne forklare deres aktivitet status [31], [32]. De kunne identificeres ved anvendelse regressionsmodellen vist i figur 1. For at beregne alle de parametre, der er nødvendige for denne model, vi identificeret gener differentielt reguleret i hver cellelinie sammenlignet med puljen af ​​alle andre cellelinjer. Det mediane antal regulerede gener pr cellelinie er 218 (min: 15 og max: 721), kumulativt involverer 4.686 unikke kendte kodning gener. Derefter blev hver cellelinje-specifikt gen liste forelagt TFactS og sammenlignes med katalog over eksperimentelt validerede TF målgener under anvendelse af Fishers test [30]. Vi har vist, at dette værktøj effektivt forudsiger TF regulering fra regulerede gen lister [33], [34]. På den anden side, SNP data blev normaliseret og segmenteret derefter indgives til transportcenter algoritme til at identificere kromosomale regioner ændres væsentligt i alle disse cellelinier [35]. Figur S1 viser, at betydelige opformeringer og sletninger blev spredt i hele genomet. En begrænset analyse af TF-kodende gener viste, at 2.113 af de 2.335 gener vides at kode for “DNA binding” proteiner (GO term) havde deres loci væsentligt ændret, i det mindste i én cellelinje. For at vælge transkriptionsfaktorer relevante for kræft i en mere stringent måde, vi kombineret analysen på udtryk, aktivitet og CNV (figur 1).

Se tekst for detaljer. Reg: regulering; Exp: udtryk; CNV: kopiere nummer variation; MCN: minimal tilsluttede netværk; PPI: protein-protein interaktioner; TF:. Transskription faktor

For hver TF blev korrelation profiler med andre TF’er beregnet på grundlag af: regulering (udledes TFactS analyse), genekspression og genomiske forandringer (CNV), hhv. Modellen i figur 1 anvender disse sammenligningstabeller scores at finde betydelig TF’er, for hvilke genekspression forbundet til CNV kunne forklare den tilsvarende udledte regulering. 88 TF’er blev identificeret (p-værdier = 0,05, tabel S1). Støtte vores resultater, CNV påvirker nogle af disse TF’er i kræft er allerede blevet rapporteret, herunder:. TP53, BRCA1, RUNX1 og MYC [36]

Minimal Connected Netværk af transkriptionsfaktorer regulerede i cancercellelinier

Vi brugte Sne web-værktøj til at identificere den minimale tilsluttede netværk (MCN) af protein-protein interaktioner, der involverer de 88 TF’er forbundet til kræft fra vores indledende analyse. Sne forudsagde dette MCN ved at beregne den korteste stier forbinder input proteiner enten direkte eller med én tolereres mellemliggende protein, baseret på en indbygget database af humane protein-protein interaktioner [37], [38]. Ikke begrænser Sne-baseret analyse til det humane protein interactome med mindst to eksperimentelle beviser for interaktion, identificerede vi et undernetværk forbinder 70 ud af 88 TF’er enten direkte eller med én mellemprodukt. Det er bemærkelsesværdigt, at de fleste af TFS identificeret i det første skridt kunne være forbundet i denne enkelt protein-protein-interaktion undernetværk. Atten TF’er blev tabt på grund af vores begrænsninger i analysen eller til deres fravær i sne-kommenteret interactome. Sne bruger Kolmogorov-Smirnov test for at vurdere betydningen af ​​de identificerede undernetværk ved at sammenligne dens betweenness, forbindelser og klyngedannelse koefficient udlodninger til dem, der genereres fra 1.000 tilfældige netværk med det samme antal proteiner. Vores identificeret subnetværket havde signifikante p-værdier for alle disse vurderede parametre (betweenness: 2.06E-37, tilslutninger: 1.68E-47, klyngedannelse coef .: 4.07E-43). Denne undernet indeholdt to særskilte tilsluttede komponenter. Den første indeholdt næsten alle interaktioner for signifikant undernet og blev betragtet som den cancercellelinie-associeret TF’er MCN til efterfølgende analyse (figur 2). Den anden tilsluttet komponent, der kun har to interaktioner forbinder tre proteiner blev kasseret.

The Snow web-værktøj identificeret en betydelig menneskelig kurateret protein-protein interaktion subnetværket involverer 70 ud af de 88 TF’er korrelativt reguleret i kræftceller. Den første tilsluttet komponent som vist her betragtes som den minimale tilsluttede netværk (MCN), der forbinder disse TF’er. Hvert knudepunkt repræsenterer et protein. Kanterne er protein-protein interaktioner valideret af mindst to eksperimentelle beviser. Nodes skraverede i violet repræsenterer de ti mest centrale TF’er i MCN. Node-ranking var baseret på betweenness centrale scoringer.

Vi spurgte derefter, om falske positiver fra TFactS, transportcenter og differential udtryk analyser kan påvirke MCN identifikation. For at styre disse effekter, vi udførte en negativ kontrol, hvor vi analyserede 100 forskellige tilfældige lister over 88 TF’er fra TFactS katalog. Hver liste blev forelagt i Snow at frembringe en MCN anvendelse af de samme parametre som ovenfor. Ved at sammenligne fordelingen af ​​betweenness scorer fra alle de tilfældige multikanalnetværk til den etablerede MCN fra vores model, fandt vi en signifikant forskel (p-værdi ~0.01; KS test). Sammen med resultaterne ovenfor diskuterede fra den indbyggede i sammenligning med 1.000 tilfældige net udføres i sne, Dette antydede, at vores identificeret MCN udgør en betydelig modul involverer TF’er almindeligvis reguleret i cancer-cellelinjer.

Denne MCN kan ses som en regulerende “rundt-om” af flertallet af regulerede veje i kræft cellelinjer. Således som afbildet i figur 3, er mange MCN proteiner involveret i mange cancertyper og kræft signalveje. Alligevel MCN proteiner er også signifikant involveret i immunrespons pathways. Dette kunne afspejle en inddragelse af nogle MCN TF’er som NFkB i både kræft og inflammation [16].

Alle proteiner (noder) i MCN blev forelagt DAVID web værktøj til Kegg pathway berigelse analyse. Væsentlige veje er vist efter kategorier i henhold til -log10 (p-værdi) og den procentdel af skæringspunktet mellem det indsendte liste og forespørges anmærkninger.

målgener af MCN Central transkriptionsfaktorer

Transskription faktorer i den minimale tilsluttede netværk identificeret ovenfor sandsynligvis repræsenterer de vigtigste regulatoriske effektorer almindeligt forstyrret i de analyserede kræftceller. Vi fokuserede på de mest centrale TF’er i dette netværk. Centrale knudepunkter i et givet net kunne estimeres ved hjælp af mange parametre. Blandt dem, betweenness scorer frekvens, hvormed en bestemt node er inden for de korteste veje forbinder to andre knudepunkter. Det menes at være et godt skøn over centrale [39]. Ved top-ranking de 236 MCN knudepunkter i henhold til deres betweenness scoringer, vi identificeret 59 centrale proteiner med score over gennemsnittet. Disse centrale proteiner viser den samme funktionelle berigelse som hele MCN.

Vi vilkårligt udvalgt de 10 bedste centrale MCN noder. Deres koder gen navne er: TP53, ESR1, CREBBP, MYC, AR, BRCA1, RELA, RARA, EP300 og NFKB2. Disse ti TF’er koncentrere 41% af de samlede betweenness kumulative scoringer af de 236 MCN noder. De kan betragtes som hubs eller samlere af disse netværk interaktioner. Dette er i overensstemmelse med “skala fri” model, der blev foreslået at regulere TF protein-protein interaktioner, hvor navene blev bygget omkring TF’er forbundet med maligniteter [40]. Vi hævdede, at almindelige kræft biomarkører vil sandsynligvis skal findes blandt målene for disse mest centrale TF’er. 874 unikke målgener af disse ti TF’er er rapporteret i TFactS katalog. En berigelse analyse af disse gener, ved hjælp af “genetisk forening db sygdom” i DAVID web-værktøj, afslørede en overrepræsentation af et stort panel af cancertyper samt ontologier relateret til immunreaktioner og inflammatoriske sygdomme (File S1).

cancer-specifikke gener fra mål af MCN Central transkriptionsfaktorer

Berigelse analyse udført på MCN proteiner samt mål for de centrale TF’er viste en sammenhæng mellem kræft og inflammation. Denne forening er veldokumenteret i litteraturen [41]. Cancer-specifikke biomarkører skal være differentielt udtrykt i kræftpatienter sammenlignet med raske individer og patienter med inflammatoriske sygdomme [42]. Desuden bør en universel cancer biomarkør være kræftspecifikke i et bredt panel af tumortyper. Da vores interesse er at identificere “tilgængelige” kræft biomarkører, vi søgte at begrænse yderligere analyse kun på gener, der koder for secernerede og transmembrane proteiner. SP-PIR annotation nøgleord database, som anvendt i DAVID værktøjet, indeholder 1.689 og 642 gener kommenteret som koder secernerede og transmembrane proteiner, henholdsvis. I de 874 målgener af de ti mest centrale TF’er i MCN, fandt vi 57 gener, der koder secernerede proteiner (p-værdi: 1.1E-6) og 110 koder for transmembrane proteiner (p-værdi: 4.3E-5). Dette repræsenterer et unikt sæt af 157 gener. Således identificerer TFS MCN og fokuserer på target gener af de ti mest centrale TF’er tilladt os at prioritere en kort liste af tilgængelige proteiner, der skal analyseres i patientprøver for differentiel ekspression (figur 1).

Vi yderligere filtreret dette gen liste ved hjælp af tilgængelige patientdata. Vi udførte genekspression analyse på en samlet microarray stort datasæt af 8,525 forskellige væv fra patienter med cancer eller inflammation og raske individer (figur 4, File S2). Fra de prioriterede 157 gener, kunne vi opstille en liste over 86 cancer-specifikke udskrifter (figur 4). Blandt dem blev 3 gener godkendt af FDA til cancerdiagnose, herunder: EGFR, KLK3 (PSA) og AFP til diagnosticering af tyktarms-, prostata- og testis-cancere, henholdsvis [43]. Desuden HLA-F i denne liste er allerede blevet rapporteret som detekteres i serum af forskellige kræftpatienter anvender indirekte ELISA [10].

Microarray genekspression data, som repræsenterer 8,525 patienter prøver blev hentet fra GEO. A- 78% af patienterne havde forskellige cancertyper; 14% er sunde individ og blev udtaget fra forskellige væv; 8% af patienterne havde inflammation /sepsis og blev undersøgt fra fuldblod og andre væv. B- differentiel ekspression af MCN top ti centrale TF’er målgen liste koder for secernerede og transmembrane proteiner blev analyseret. Blandt disse gener, som vist på Venn-diagram, 140 probesæt (86 unikke gener) fandtes at være cancer-specifik. GI:. Gastrointestinale

Potentiale Biomarkører Common i Cancer

For at styrke sandsynligheden for at finde potentielle fælles biomarkører blandt kræft-specifikt gen liste (figur 5), vi filtreret disse gener baseret på deres signifikant effekt på patientens overlevelse i nogen af ​​de typer kræft fra TCGA database. De tilgængelige genekspression datasæt fra TCGA, der dækker ni kræftformer, blev hentet og analyseret separat for gen-overlevelse forening. For hvert gen blev patienterne opdelt i tre grupper (tertiles) ifølge ekspressionsniveauerne af det undersøgte gen. Grupper af patienter med lav, mellem og høje ekspression blev derefter opnået. Gør brug af den tilgængelige patientens overlevelse data: opfølgning varighed og død status, vi monteret Kaplan-Meier kurver til disse grupper. Gener forudsige patientoverlevelse signifikant (log-rank p-værdi = 0,05), i mindst én cancer type, er vist i tabel S2. Produkterne af disse 50 gener mægle mange interagerende veje i kræft, som er afbildet i figur S2 (Kegg vej berigelse, p-værdi ~4.29E-4).

Kræft-specifik genekspression betydning og fold forandring. Signifikans blev afsluttet med B-H p-værdi korrektion, og alle viste gener har B-H p-værdi = 0,05. Bar-plots viser -log10 (ukorrigerede p-værdi). Trekanter viser logget gange ændring af det tilsvarende gen i cancer sammenlignet med raske og inflammation patientens fænotyper. FDA godkendt kræft biomarkører er markeret med (*)

For hvert gen anført i tabel S2, vi tilføjet følgende ressourcer:. (I) CNV væsentlig grad berører det tilsvarende gen loci i alle tumortyper som analyseret i Tumorscape databasen [44]; (Ii) procentdel af immunhistokemiske (IHC) positiv farvning i kræft som påvist i ProteinAtlas database [45]. Vi mente, at gener positive for alle kriterierne i tabel S2 er mere tilbøjelige til at være fælles kræft biomarkør kandidater. TFRC, VEGFA og MET er de bedste potentielle kandidater. Disse gener er blevet særskilt forbundet til mange cancertyper i litteraturen (Tabel S3).

Diskussion

Cancer typer er blevet screenet separat for biomarkør identifikation. I dag er der er en spirende forsøg på at søge efter universelle kræft markører. De seneste tilgængelige high-throughput data fra kræft patient prøver gøre denne opgave mere overkommelige i forbindelse med integrativ analyse. Denne undersøgelse blev udført inden for en sådan ramme.

Kræft er en flertrins sygdom, hvor normale celler gradvist omdannes til maligne dem. Denne proces indebærer transskription faktor (TF) regulering for at sikre transkription af nødvendige gener [46]. Vi antog, at TF’er reguleret i kræft ville have deres aktivitet forklares ved deres kodning genekspression niveau og genomiske forandringer. Vi antager, at cancerassocierede TF’er kan interagere sammen på en modulær måde, således at kræft-udløsende hændelser ender forstyrrende funktionen af ​​dette modul. Biomarkører er fælles for mange cancertyper kunne være blandt disse TF målgener. Vi fulgte derefter arbejdsgangen afbildet i figur 1 til at målrette vigtige gener almindeligvis reguleret i kræft, der koder tilgængelige proteiner. Vi antog, at fokusere på TF’er vil guide os til at finde den mest værdifulde del af kræft oplysninger, som kunne måles ved genekspression [47]. Tilføjelse CNV data til at filtrere vigtigt TF’er vil styrke denne tilgang. Betragtninger, analysere alle regulerede gener og væsentligt ændrede kromosomale regioner uden kontekstualisering i form af regulatorer (TFS) vil udvande den almindelige kræftform biomarkør blandt mange falske positive resultater.

Som et første skridt i vores søgen efter fælles kræft biomarkører , vi forsøgte at identificere den minimale tilsluttede netværk involverer TFS hvis aktivitet er reguleret i tumorer. Vi har integreret genomforskning og transcriptomics data fra et panel af cancercellelinjer, sammen med udledte TF regulering fra genekspression ved anvendelse TFactS, som har vist sig tidligere at være i stand til at udlede præcist TF regulering eller aktivitet status fra en liste af udtrykte gener [30] . Brugen af ​​cellelinier i dette trin er begrundet findes både genomiske og udtryk data. Desuden bygger meningsfuld MCN kræver data fra homogene celler, hvilket ikke er tilfældet med de fleste primære cancer prøver, hvor genomiske ændringer og genekspression afviger mellem cancerceller og stromaceller og endog mellem forskellige cancercellelinier kloner. Vi identificerede 88 TF’er, som kunne være de vigtigste regulatorer i kræft cellelinjer. Dette trin er imidlertid begrænset af TFS repræsenteret i TFactS, selv om de prøve de mest undersøgte TF’er i litteraturen. Dette trin kan også forbedres ved under hensyntagen til andre genomiske forandringer, såsom mutationer. Men hele genom ombygning data ikke var tilgængelige endnu for alle de undersøgte cellelinjer.

Ved protein-protein interaktion analyse, MCN forbinder størstedelen af ​​88 TF’er er blevet identificeret fra kurateret menneskelige proteom netværk. Den MCN indeholder både TF’er og andre proteiner. Berigelse analyse viste, at denne MCN samler store kendte veje kørsel flere kræftformer. Slående, blev immunrespons veje også beriget med MCN, der blev identificeret på grundlag af cellelinje data, kasserer enhver tumor mikro-miljø effekt på disse resultater. Dette tyder på en dobbelt rolle ved dette modul af tilsluttede TF’er i både kræft og inflammation spiller. Resultater fra vores negative kontrolprocedure foreslået, at kræft-associerede MCN danner en betydelig modul. Denne modulets mest centrale TF’er er modtagelige til at fungere som de vigtigste “samlere” af marginale forstyrrelser.

I et andet trin, vi vilkårligt begrænset vores analyse til at målrette gener af de ti mest centrale MCN TF’er. Berigelse analyse af disse gener afslørede en kræft kontekst veje overrepræsentation, som forventet. Da vores formål var at identificere gener, der let kunne sonderet hos patienter, vi filtreret dette gen liste til 157 gener, der koder for secernerede og transmembrane proteiner. Ved at sammenligne deres udtryk i et panel af 8,525 patienter, vi identificeret et sæt af 86 cancer-specifikke gener udtrykkes forskelligt i kræft versus normale og betændelse fænotyper. De omfatter tre ud af seks proteiner godkendt af FDA i specifik cancer diagnose: PSA /KLK3, EGFR og AFP. Ekspression af disse tre gener kan kontrolleres i andre typer cancer. PSA, prostata specifikt antigen, for eksempel, selv om meget udbredt i prostatakræft diagnose, blev det også rapporteret i nyre, mave og brystcancer [48] – [50]. Disse resultater giver en intern validering af vores metodologi.

Vi gik ud på at begrænse analysen ved at tage højde for den potentielle prognostiske værdi i mindst én cancer type. Dette blev udført ved at knytte genekspression til patient overlevelse i TCGA datasæt. 50 gener signifikant forudsagt overlevelse i mindst én cancer type. Hvert af disse gener kunne undersøges separat i tilsvarende cancer type for prognose. Disse gener er signifikant involveret og sammenkoblet i mange kræft veje (Figur S2). Ikke desto mindre blev immunmodulerende cytokiner og kemokiner også beriget med dette gen liste, hvilket kunne tyde på, at nogle af disse gener kan ikke helt skelne patienter med kræft fra dem med inflammatoriske sygdomme.

Vi identificerede tre potentielle biomarkører fælles for kræft, dvs TFRC, VEGFA og MET som det fremgår af: (i) gen overekspression i cancer i forhold til normal og betændelse; (Ii) genekspression signifikant knyttet til patientoverlevelse i mindst to cancertyper; (Iii) svarende CNV fokalt signifikant amplificeret i tumorer; (Iv) proteiner farvet positive i mere end 80% af cancere. VEGFA fremmer angiogenese. Dets diagnostiske potentiale blev undersøgt separat i mange cancertyper (Tabel S3). MET, er en kendt onkogen tyrosinkinasereceptor for hepatocytvækstfaktor. Det er også forbundet med mange cancertyper (Tabel S3). Desuden er det blevet rapporteret som en markør for cancer stamceller i: prostata, hoved og hals, lever, hjerne og lungekræft [51] – [56]. VEGFA og MET synergi i angiogenese kan målrettes mere effektiv anti-tumoral terapi [57]. TFRC, transferrin receptor, er kendt for at blive udtrykt i mange tumortyper (Tabel S3). Ekspression af VEGFA og TFRC er almindeligt reguleret af HIF og MYC, som fremmer angiogenese og spredning henholdsvis [58] – [60]. Forbindelsen mellem disse to TF’er via deres målgener vides at indebære en stofskiftefordel til tumorer under hypoxi, hvilket er en almindelig tilstand i maligne sygdomme [61], [62].

Sammenfattende identificeret vores strategi et netværk af TF’er der regulerer 50 potentielle fælles cancer biomarkører. De tilgængelige data i TCGA, Tumorscape og ProteinAtlas databaser pegede på VEGFA, TFRC og MET gener som potentielle kandidater. Litteratur viden i forbindelse med disse gener bestyrker vores tilgang. Tilsammen kan alle disse observationer tyder for yderligere at undersøge nytten af ​​VEGFA, MET og TFRC som fælles kræft biomarkører. Dette kan udføres ved direkte påvisning af disse biomarkører, eller ved kontrol for tilstedeværelsen af ​​auto-antistoffer rettet mod potentielle cancer proteiner i patientserum, en tilgang, der har vundet stor interesse for cancer diagnose område [4], [63].

Materialer og metoder

microarray analyse

data fra 950 mikroarrays udført af GlaxoSmithKlein laboratorier (GSK) på forskellige cancer cellelinjer blev hentet fra arrayExpress (E-mtab-37) . RMA normaliseringsmetode blev påført under anvendelse af XPS pakke fra R /BioConductor [64]. Genekspression på hver cellelinje blev udført på dubletter eller triplikater. Kolmogorov-Smirnov test blev udført for at vælge gener udtrykkes differentielt i hver cellelinje sammenlignet med andre. En Bonferroni korrektion tærskel blev anvendt på p-værdier. Gener med en e-værdi = 10 blev betragtet som signifikant differentielt udtrykt på den tilsvarende cellelinje.

transkriptionsfaktor forordning Analyse

Hvert gen liste reguleret i hver cellelinje blev underkastet TFactS at forudsige regulerede TF’er [30]. TFactS underskrive mindre katalog (version 2) indeholder 6.823 forordninger forbinder 345 unikke TF’er til deres 2.650 unikke gen mål. For hver liste over regulerede gener, TFactS forudsiger TFS hvis mål er beriget i de indsendte lister ved hjælp af Fishers test. I denne undersøgelse blev den større sign-mindre katalog anvendes i stedet for den begrænsede sign-følsom. TFactS blev henrettet ved hjælp BatchTFactS standardparametre (www.tfacts.org). TF’er med en positiv e-værdi score (-log10 (e-værdi)) blev betragtet som signifikante. TF’er der ikke var signifikant i alle cellelinjer blev kasseret før modellen montering.

Genomisk Copy Number Variation Analysis

De genomics data af ovennævnte cellelinjer blev også udgivet af GSK. SNP arrays datasæt til rådighed på arrayExpress blev downloadet (E-mtab-38). De blev analyseret ved hjælp af aroma-Affymetrix pakke på R /BioConductor [65]. Kort vi anvendt en fraktil normalisering efterfulgt af CrmA sammendrag og korrigeret for chip og PCR fragment længde effekter [66]. Så GLAD algoritme blev anvendt på rå kopi numre for segmentering [67]. De segmenterede data blev derefter forelagt transportcenter algoritme til at finde væsentligt ændrede områder i alle kromosomerne undtagen X og Y. En standard q-værdi tærskel på 0,25 blev anvendt til at vælge betydelige områder [35]. Forud for CNV-baserede korrelation matrix computing og modellen montering, blev CNV-værdier for hvert gen i de væsentligt ændrede kromosomale regioner normaliseret som følger: (i) for hver af de transportcenter-rapporteret væsentlige områder, vi bestemt medianværdien af ​​den betydelige CNV toppe; (Ii) hvert gen i en signifikant kromosomal region er blevet tildelt værdien af ​​denne median. Værdierne af CNV var i log2-forhold som udsendt ved transportcenter. Det kromosomale placering af gener blev opnået ved hjælp af de Ensembl gener 64 database med menneskelige “GRCH37.p5” udgivelse i Biomart web værktøjet [68].

Identifikation af Minimal Connected TF Reguleret i kræftceller

for at identificere et sæt af korrelerede TF’er, der almindeligvis er reguleret i kræft, vi betragtede 305 cellelinjer, hvor der både udtryk og SNP data var tilgængelige. Hvert TF har tre målinger i hver cellelinje: TF regulering scorer anslået af TFactS (-log10 (e-værdi)), TF gen udtryk (fra microarrays) og TF-locus kopi nummer variationer (fra median normaliseret transportcenter analyse). Tre matricer, med TF’er i rækker og celle-linjer i kolonner, kunne bygges ud fra disse data: en TF regulering matrix, en TF-koder genekspression matrix og en TF-locus CNV matrix. I hver af disse matricer, vi beregnede korrelationer af hver TF med de andre TF’er vha Pearson korrelationskoefficienten. Disse sammenhænge kan være repræsenteret som TF-TF korrelation profiler. Så vi monteret følgende model for hver TF:

R = β

0+ β

1 * E + β

2 * C

, hvor:

(R ) TF-TF korrelation profil baseret på TFactS scoringer, kun TF’er signifikant reguleret i mindst en cellelinje blev anvendt; (E) TF-TF korrelation profil baseret på genekspression; (C) TF-TF korrelation profil fra væsentlige områder identificeret ved transportcenter algoritme, blev disse korrelationer beregnet ved hjælp af loci kopi nummer variation median-normaliseret værdier.

Hver TF havende

β

1

(p-værdi = 0,05) og

β

2

(p-værdi = 0,05) blev betragtet som korrelativt reguleret i kræft.

Be the first to comment

Leave a Reply