PLoS ONE: Identifikation af kolorektal cancer gener med mrmr og korteste vej i Protein-Protein Interaction Network

Abstrakte

En af de vigtigste og mest udfordrende problemer i biomedicin og genomik er, hvordan man identificere sygdomsgener. I denne undersøgelse har vi udviklet en beregningsmetode til at identificere colorektale cancerrelaterede gener baseret på (i) genekspressionsprofilerne, og (ii) den korteste vej analyse af funktionelle proteinassociation netværk. Førstnævnte har været brugt til at vælge differentielt udtrykte gener som sygdomsgener i temmelig lang tid, mens sidstnævnte er blevet bredt anvendt til at undersøge mekanismen af ​​sygdomme. Med de eksisterende protein-protein interaktion data fra STRING (Søg Værktøj til Retrieval interagere Gener), en vægtet funktionelt protein forening netværk blev bygget. Ved hjælp af mrmr (Maximum Relevans Minimum Redundans) tilgang blev seks gener identificeret, som kan skelne mellem de kolorektale tumorer og normale tilgrænsende colonvæv fra deres genekspressionsprofiler. I mellemtiden, i henhold til den korteste vej tilgang, vi yderligere fundet yderligere 35 gener, hvoraf nogle er blevet rapporteret at være relevante for kolorektal cancer og nogle er meget sandsynligt, at være relevant for det. Interessant generne vi identificeret fra begge genekspressionsprofilerne og funktionelt protein association netværk har flere cancer-gener end generne identificeret fra genekspressionsprofilerne alene. Desuden disse gener havde også større funktionel lighed med de rapporterede kolorektal cancer gener end generne identificeret fra genekspressionsprofilerne alene. Alle disse viser, at vores metode, som præsenteres i dette papir er ganske lovende. Metoden kan blive et nyttigt redskab, eller i det mindste spiller en supplerende rolle til den eksisterende metode, til at identificere kolorektal cancer gener. Det har ikke undgået vores meddelelse, der kan anvendes metoden til at identificere de gener af andre sygdomme samt

Henvisning:. Li BQ, Huang T, Liu L, Cai YD, Chou KC (2012) Identifikation af kolorektal kræftrelaterede gener med mrmr og korteste vej i Protein-Protein Interaction Network. PLoS ONE 7 (4): e33393. doi: 10,1371 /journal.pone.0033393

Redaktør: Paulo Lee Ho, Instituto Butantan, Brasilien

Modtaget: September 13, 2011; Accepteret: 13. februar 2012; Udgivet: April 4, 2012 |

Copyright: © 2012 Li et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev støttet af tilskud fra National Basic Research Program Kina (2011CB510102, 2011CB510101, 2011CB910200 og 2010CB912702), Natural Science Foundation of China (90.913.009), Chinese Academy of Sciences (KSCX2-EW-R-04), et nationalt høj Tech Program Grant 2012AA022802 og Innovation Program for Shanghai Municipal Education Kommissionen (12ZZ087). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Kolorektal cancer (CRC) er en af ​​de mest almindelige maligne sygdomme i de vestlige lande og en væsentlig årsag til kræft-relaterede dødsfald. Tidlig påvisning af CRC kan reducere morbiditet og forbedre prognosen. Det er derfor af stor betydning at identificere cancerrelaterede gener, der kan anvendes som biomarkør til tidlig diagnosticering.

For nylig, med udviklingen af ​​højt gennemløb bioteknologi, en stor mængde biologisk data er blevet genereret, såsom gær to-hybrid-systemer, proteinkompleks og genekspressionsprofiler etc. Disse data er nyttige ressourcer til udledning og forstå genfunktioner [1], [2], [3], [4], [5], [6 ], [7], [8]. Hidtil protein-protein-interaktion (PPI) data er blevet meget anvendt til gen-funktion forudsigelse med den antagelse, at interagerende proteiner har samme eller har lignende funktioner og dermed kan være involveret i den samme vej. Denne “skyldig ved association” -reglen blev først foreslået af Nabieva et al. [9], og kan også bruges til at identificere kræft relaterede gener.

STRING er en online database ressource, som er en forkortelse for Search Tool for Retrieval interagere Gener [10]. Det giver både eksperimentel samt forudsagt interaktion oplysninger med tillid score. Algoritmer baseret på PPI tyder på, at proteiner med korte afstande til hinanden i netværket er mere tilbøjelige til at dele de fælles biologiske funktioner [11], [12], [13], [14], og at interaktive naboer er mere tilbøjelige til at have identisk biologisk funktion end ikke-interaktive dem [15], [16]. Dette skyldes, at forespørgslen protein og dets interaktive proteiner kan danne et proteinkompleks til at udføre en bestemt funktion eller involveret i en samme vej.

Selvom den vellykkede anvendelse af high-throughput data for genfunktion Fortabelse og identifikation af nye gener, der er forbundet med kræft, fejlene i high-throughput data er ikke godt løst endnu. I dette papir, foreslog vi en ny fremgangsmåde til identifikation CRC beslægtede gener ved at integrere genekspressionsprofil og en vægtet funktionelt protein association netværk konstrueret med PPI data fra STRING. Denne metode kan gøre op mangel, kun ved hjælp af high-throughput data. I mellemtiden blev mrmr (maksimal relevans minimum redundans) algoritme [17] anvendes til identifikation af seks lovende kandidatgener adskiller tumor og normale colorektale prøver. Den Dijkstra algoritme [18] blev anvendt til at konstruere de korteste veje mellem hvert par af de seks gener. Desuden blev yderligere 35 gener på disse korteste veje også identificeret og analyseret. For sådant gen således identificeret, blev det observeret, at de indeholdt flere cancer-gener end generne identificeret fra genekspressionsprofilerne alene. Desuden de 41 gener havde også større funktionel lighed med de rapporterede CRC gener end generne identificeret fra genekspressionsprofiler alene. Det forventes, at nogle af de 41 gener således identificerede kan tilhøre nye CRC relaterede gener.

Materialer og metoder

Datasæt

Vi brugte genekspression data fra kolorektal kræft undersøgelse af Hinoue et al. [19]. Den genekspressionsprofilering af 26 colorektale tumorer og matchede histologisk normale tilstødende colon vævsprøver blev hentet fra NCBI Gene Expression Omnibus (GEO) under accessionsnummer af GSE25070. Genekspressionsprofilen blev opnået ved anvendelse af Illumina Ref-8 hel-genom-ekspression BeadChip med 24526 prober svarende til 18491-gener. Signal intensitet blev log2 transformeret og derefter normaliseret med RSN (Robust spline Normalisering) metode.

Vævsprøve repræsentation

På baggrund af ovenstående, at repræsentationen af ​​en vævsprøve kan formuleres som en 24526- D (dimensional vektor), som givet ved (1), hvor repræsenterer vævsprøve, værdien af ​​sin sonde, og transponering matrix (jf Eq.6 af [20]).

cancerrelateret gen liste og to kolorektal cancer relaterede gen lister

vi kompileret tre gen lister fra offentlige databaser og offentliggjorte værker til at sammenligne med de 41 kandidatgener vi identificeret. Disse tre gener lister omfattede en cancerrelateret gen liste og to kolorektal cancer relaterede gen lister.

742 cancerrelaterede gener blev afledt fra tre kilder. Først, vi opnåede 457 cancer-relaterede gener fra Cancer Gene Census of Sanger Centre. For det andet, vi hentede cancer-relaterede gener fra Atlas for Genetik og Cytogenetisk i onkologi [21]. Den tredje del blev indsamlet fra det humane protein reference Database [22]. Se Støtte Information S1.

Den første kolorektal cancer relaterede gen Listen blev hentet fra studiet af Sabates-Bellver og kolleger [23]. De sammenlignede transcriptomes af 32 adenomer med normal slimhinde fra de samme individer og identificeret 438 gener med markant ændret udtryk i kolorektale adenomer forhold til den normale slimhinde med Affymetrix U133 Plus 2.0 array. Se Støtte Information S1.

Den anden kolorektal cancer relaterede gen Listen blev hentet formular en nylig arbejde Nagaraj et al. [24]. De foreslog en boolesk baserede systemer biologi tilgang med skyld-by-association algoritme til at identificere nye cancer-associerede gener. Vi kompileret alle 134 nye CRC gener er identificeret i denne undersøgelse. Se Støtte Information S1.

PPI data fra STRING

Den oprindelige vægtede PPI netværket blev hentet fra STRING (version 9.0) [10] (https://string.embl.de/), der er en stor database af kendte og forudsagte protein-interaktioner. Proteiner i samspillet netværket var repræsenteret med knudepunkter, mens vekselvirkningen mellem to proteiner deri var repræsenteret med en kant. Disse interaktioner indeholder direkte (fysisk) og indirekte (funktionelle) interaktioner, der stammer fra mange kilder, såsom eksperimentelle repositories, beregningsmæssige forudsigelse metoder. I netværket, er hver kant markeret med en score at kvantificere interaktionen tillid, dvs. sandsynligheden for, at der kan forekomme en interaktion.

Den mrmr (maksimal relevans minimum redundans) metode

For at finde de gener, der kan skelne colorektale tumorer og normale tilstødende væv, vi bruges mrmr metoden, som oprindeligt blev udviklet af Peng et al. [17] til analyse af microarray data. Den mrmr metode kan rangere gener efter deres relevans til klassen af ​​berørte prøver, og i mellemtiden også kunne tage redundans af gener i betragtning. Disse gener, der har den bedste afvejning mellem den maksimale relevans til prøven klasse og minimum redundans, blev betragtet som “gode” biomarkører.

Både relevans og redundans blev kvantificeret af følgende gensidig information ( MI) 🙁 2), hvor og er vektorer, er deres fælles probabilistiske tæthed, og og er de marginale sandsynlighedsteoretiske tætheder.

for at kvantificere både relevansen og redundans, lad os definere som helt gen sættet, som allerede udvalgte gen sæt indeholdende gener og som til-være-udvalgte gen sæt indeholdende gener. Relevansen mellem genet i og målet kan beregnes ved: (3) redundans mellem genet ind og alle generne i kan beregnes ved: (4) For at opnå genet ind med den maksimale relevans og minimal redundans lad os kombinere Eq.3 og Eq.4, som kan formuleres som følger: (5) da et gen sæt med gener, vil mrmr operation for genet evaluering fortsætte runder. Efter disse evalueringer vil mrmr metode generere et gen indstillet som formuleret af (6), hvor indekset angiver, hvilken runde genet er valgt. Jo mindre indekset er, jo tidligere genet tilfredse Eq.5 og bedre genet er.

Prediction motor

I denne undersøgelse nærmeste nabo Algorithm (NNA) [25], [26], som er blevet meget udbredt i bioinformatik og bioinformatik [3], [27], [28], [29], [30], [31], [32], [33], [34], blev vedtaget for at forudsige klassen af ​​kolorektale vævsprøver. Den “nærhed” blev beregnet ifølge den følgende ligning (7) hvor og er to vektorer repræsenterer to vævsprøver, er deres dot produkt og har deres moduluses. Jo mindre, jo mere lignende de to prøver er [35]. For en intuitiv illustration af, hvordan NNA værker, se Fig.5 af [20].

Ydelse validering

De følgende tre tværgående valideringsmetoder anvendes ofte i statistikken til validering en statistisk forudsigelse metode : uafhængige datasæt test, subsampling test, og slingrebremse test [36]. Men blandt de tre valideringsmetoder, den lommekniv testen er den mindst vilkårlig skyldes følgende kendsgerninger. (I) For det uafhængige datasæt test, selv om alle de prøver, der anvendes til at teste prædiktor er uden for uddannelse datasæt til at træne forudsigelsen motor, således at udelukke “memory” effekt eller partiskhed, den måde, hvordan du vælger de uafhængige stikprøver at teste prædiktor kunne være helt vilkårlig, medmindre antallet af uafhængige prøver er tilstrækkelig stor. Denne form for vilkårlighed kan føre til helt modsatte konklusioner. For eksempel kan den konklusion, at en prædiktor gav en højere succesrate end den anden indikator for en given uafhængig test datasæt bliver lige overfor, når de testes af en anden uafhængig test datasæt [36]. (Ii) For subsampling test, den konkrete procedure normalt anvendes i litteraturen er den 5-fold, 7-fold eller 10-fold krydsvalidering. Problemet med denne form for subsampling test er, at antallet af mulige valg i at dividere et benchmark datasæt er meget store, selv for en meget enkel og lille datasæt, som belyst i [37] og demonstreret af Eqs.28-30 i [20] . Derfor, i eventuelle faktiske undersampling cross-valideringsforsøg, er kun en meget lille brøkdel af de mulige valg tages i betragtning. Da forskellige markeringer altid vil resultere i forskellige udfald selv for en samme benchmark datasæt og en samme indikator, kan subsampling testen ikke undgå vilkårlighed enten. En testmetode stand til at give en unik resultat kan ikke betragtes som et godt. (Iii) I lommekniv test, vil alle prøverne i benchmark datasæt fremhæves én efter én, og testet af prædiktor trænet af de resterende prøver. Under processen med overdrejning, både træning datasæt og afprøvning datasæt er faktisk åbne, og hver prøve vil være på sin side flyttes mellem de to. Den slingrebremse test kan udelukke “memory” effekt. Desuden kan vilkårlighed problemet som nævnt ovenfor for den uafhængige datasæt test og undersampling test undgås, fordi det opnås ved lommekniv test resultat er altid unik for et givet benchmark datasæt. Følgelig har lommekniv test blevet bredt og i stigende grad anvendt til at undersøge kvaliteten af ​​forskellige prædiktorer (se fx [30], [31], [32], [38], [39], [40], [41] , [42], [43], [44], [45], [46]). . I overensstemmelse hermed i denne undersøgelse lommekniv testen blev også brugt til at undersøge kvaliteten af ​​den aktuelle forudsigelse metode

forudsigelse nøjagtighed blev formuleret af (8), hvor TP repræsenterer den sande positive; TN, den sande negative; FP, den falske positive; og FN, den falske negative.

Trinvis funktion valg (IFS)

Baseret på de klassificeret gener efter deres betydning efter mrmr evaluering, vi brugte den Incremental Feature Selection (IFS) (se, fx [1], [47]) for at bestemme det optimale antal gener som biomarkører. Under IFS procedure, er gener i rangeret gensæt tilsat en efter en fra højere til lavere rang. Et nyt gen sæt består, når der tilsættes et gen. Således gensæt skal bestå, når det gives sorteret gener. Genet sæt er (9) For hver af de N gen sæt blev en NNA prædiktor konstrueret og undersøgt ved hjælp af lommekniv test til benchmark datasæt. Derved opnåede vi en IFS bord med en kolonne for indekset

jeg

og en anden kolonne til forudsigelse nøjagtighed. Således kunne vi opnå den optimale gen sæt (), hvormed prædiktor ville give den bedste forudsigelse nøjagtighed.

Graph tilgang og korteste veje sporing

Grafer er et nyttigt redskab til at studere komplekse biologiske systemer, fordi de kan give intuitive indsigt og den overordnede struktur ejendom, som påvist i flere undersøgelser på en række vigtige biologiske emner (se fx [48], [49], [50], [51], [52], [53], [54], [55], [56], [57], [58]). I denne undersøgelse, vi først konstrueret en graf G (V, E) med PPI data fra STRING. I grafen, blev en kant tildelt for hvert par af gener, hvis de var i samspil med hinanden. Vægten af ​​kant E i graf G stammer fra den tillid score efter ligningen, hvor er vægten i grafen G, mens er tillid score mellem to berørte proteiner. Således får vi et funktionelt protein association netværk med kant vægt. Dijkstra algoritme [18] blev anvendt til at finde den korteste vej fra hver af de seks gener til alle de andre fem gener i grafen. Så vi plukket ud alle de gener, der findes i de korteste veje og rangordne disse gener efter deres betweenness.

Kegg berigelse analyse

Funktionel annotation værktøj af DAVID [59] blev brugt til Kegg vej berigelse analyse. Den berigelse p-værdi blev korrigeret til at styre familien hele falsk opdagelse sats under visse sats (f.eks ≤0.05) med Benjamin multiple test korrektion metode [60]. Alle gener på BeadChip blev valgt som baggrund under berigelse analyse.

Resultater

mrmr resultater

Udtrykket profil blev hentet fra GEO med tiltrædelse antal GSE25070, som indeholdt 52 ​​prøver og 24,526 sonder og blev omdannet til en CSV-fil med 52 rækker og 24526 kolonner som input af mrmr. Hver sonde repræsenterede en funktion og de 26 tumor prøver tilhørte klasse 1, mens paired26 parrede normale prøver tilhørte klasse 2. Efter at have kørt mrmr software, vi opnåede to tabeller (se Støtte Information S2), hvoraf den ene blev kaldt MaxRel tabel, rangeret sonderne efter deres relevans for klassen af ​​prøver, og den anden kaldes mrmr funktionen tabel, der er anført sonderne med maksimal relevans og minimum redundans til klassen af ​​prøver.

Seks kandidatgener identificeret af NNA og IFS

på grundlag af resultaterne af mrmr, vi bygget 1000 har delmængder ifølge Eq.9. Som beskrevet i afsnittet Materialer og metoder, vi testede indikator med et træk, to funktioner, tre funktioner, osv, og IFS resultat kan findes i Støtte Information S3. Vist i fig. 1 er IFS-kurven plottet baseret på data fra Støtte Information S3. I IFS kurve, X-aksen er antallet af prober, der anvendes til klassifikation, og Y-aksen er den forudsigelse nøjagtighed af den nærmeste nabo algoritmen evalueret af lommekniv testen. Den maksimale nøjagtighed var 1, da 6 funktioner blev inkluderet. Den optimale sonde sæt inkluderet 6 sonder svarende til 6 forskellige gener, som var GUCA2B, PI16, CDH3, SPIB, BEST2, og HMGCLL1 (tabel 1).

I IFS-kurven, X-aksen er for antal sonder anvendes til klassificering, og Y-aksen til forudsigelse nøjagtighed ved nærmeste nabo algoritmen (NNA) vurderes af lommekniv (Leave-One-Out) krydsvalidering test. Toppens nøjagtighed var 1 med seks prober. De øverste 6 sonder i mrmr sonden listen dannede optimale diskriminerende sonde sæt.

korteste veje gener

I mellemtiden har vi konstrueret en ikke-orienteret graf med PPI data fra STRING . Så vi plukket ud to gener fra de seks generne identificeret med mrmr fremgangsmåde som beskrevet ovenfor, og fandt ud af den korteste vej mellem disse to gener med Dijkstra algoritme. Vi opnåede i alt 15 korteste veje med laveste omkostninger (Støtte Information S4). Vist i fig. 2 er de 15 korteste veje mellem de seks kandidatgener, hvor interaktionen tillid blev mærket på kanten for hver af interaktion genpar. Der var i alt 35 gener på de korteste veje og vi rangeret disse gener efter deres betweenness (tabel 2). Blandt disse 35 gener, AR har den største betweenness på 7, hvilket betyder, at der er 7 korteste veje går gennem dette gen. Følgelig kan AR spille en vigtig rolle i at forbinde de seks kandidatgener og dermed kan være relateret til CRC. En sådan konklusion er i fuld overensstemmelse med det faktum, at AR-protein blev fundet i normal colorektal mucosa såvel som i de fleste CRC [61], [62], hvilket indebærer, at AR-receptoren er ansvarlig for de mitogene virkninger af hormonet som det vil blive yderligere drøftet senere.

de 15 korteste veje mellem de seks kandidatgener blev identificeret med Dijkstra algoritme baseret på PPI data fra STRING. Gul roundrect repræsenterer de øverste seks kandidatgener identificeret af mrmr metoden. Røde runde repræsenterer de 35 gener eksisterende inden for området af de korteste veje. Numre på kanterne repræsenterer kant vægte for at kvantificere interaktionen tillid. Jo mindre tallet er, jo stærkere interaktion mellem to knudepunkter er. Se teksten i afsnit af “Graph tilgang og korteste veje sporing” for det kvantitative forhold af kanten vægt med den tillid score mellem to berørte proteiner.

For at teste, om vores 35 kortest sti gener var knudepunkter i baggrunden netværk eller ej, vi kørte en permutation at tælle forekomsten tid af vores 35 korteste vej gener i de korteste veje mellem 6 tilfældige udvalgte gener, når de har større betweenness end i vores undersøgelse. Vi gentog denne proces 5000 gange, og p-værdien blev beregnet som den andel af forekomsten tid af de 35 gener i 5000 permutation. For detaljer, se tabel 2. Der var 10 korteste vej gener, hvis p-værdier var ikke signifikant. TP53 var en stjerne molekylær involveret i talrige biologiske processer og næsten relateret til alle former for kræft [63]. Det er derfor ikke noget overraskende, at TP53 optrådte mange gange i korteste vej mellem 6 tilfældigt valgte gener. For EP300, er det blevet rapporteret, at dette gen kan acetylere TP53 og forbundet med masser af tumorer [64]. CTNNB1 og GSK3b tilhører Wnt signalvejen, hvis rolle i caners er veldokumenteret [65]. For de resterende ubetydelige 6 gener, deres betweennesses i vores undersøgelse blev alle on (tabel 2), og dermed antallet af forekomster for disse gener i tilfældige korteste veje er tilbøjelig til at være større end en. De fleste af disse ubetydelige 6 korteste vej gener sakke agterud i tabel 2 i henhold til deres betweennesses, hvilket tyder på, at de ikke kan være vigtigt. Ud over disse 10 gener, blev de resterende 25 korteste vej gener i vores undersøgelse identificeret til at være betydelige.

MaxRel tabel gen Kegg berigelse

Brug af funktionelle annotation værktøj af David, Kegg pathway berigelse analyse blev gennemført for de gener, der svarer til de 1000 sonder, der er anført i MaxRel. De berigelse Resultaterne viste, at disse gener blev væsentligt beriget i energimetabolismen veje, herunder fedtsyremetabolisme, pentose og glucuronat indbyrdes omdannelser samt stivelse og saccharose metabolisme (tabel 3). Disse resultater antydede, at omsætning af næringsstoffer kan spille afgørende rolle i tumorgenese af CRC.

Seks kandidatgener og korteste stier gener af Kegg berigelse

Kegg vej berigelse analyse blev også udført på de 41 gener, herunder de øverste seks gener i mrmr listen og 35 gener i de korteste veje mellem disse seks gener med den funktionelle annotation værktøj DAVID. Den således opnåede berigelse resultat viste, at disse gener blev signifikant beriget med kanonisk cancer relaterede pathways, såsom prostatacancer, veje i cancer, Wnt signalvejen, cellecyklus, colorektal cancer, thyroidcancer, og så videre. Det er lærerigt at bemærke, at blandt disse veje, nogle vist sig at være relevante for kolorektal cancer, herunder Wnt signalvejen, cellecyklus, kolorektal cancer og insulin signalvejen (tabel 4).

Overlap med kræftrelaterede gen liste og to CRC relaterede gen lister

Vi kompileret 742 cancer-relaterede gener fra følgende tre forskellige kilder: Cancer Gene Census fra Sanger Centre, Atlas for Genetik og Cytogenetisk i onkologi [21], og Humant protein reference Database [22]. Det blev observeret, at 8 af de 41 gener identificeret ved os blev vist sig at være cancerrelaterede gener. Det blev også angivet af Fishers eksakte test, at disse 41 gener blev signifikant relateret til cancer (p-værdi = 0,0001908). Se Støtte Information S5.

Desuden har vi indsamlet 438 gener, der blev udtrykkes forskelligt mellem kolorektale adenomer og normal slimhinde fra tidligere undersøgelse [23]. Interessant, de førnævnte 41 kandidatgener identificeret ved os havde et overlap på 4 gener med de 438 gener, og overlapningen var helt signifikant (p-værdi = 0,01057, Fishers eksakte test). Se Støtte Information S5.

For nylig blev den booleske baserede systembiologi tilgang anvendes til at identificere 134 nye CRC relaterede gener [24], hvoraf tre blev identificeret ved os i denne undersøgelse, og overlapningen var signifikant (p- value = 0.002017, Fishers eksakte test). Se Støtte Information S5.

Diskussion

Kegg berigelse af MaxRel gener

Generne, der svarer til de 1000 sonder, der er anført i MaxRel tabellen blev væsentligt beriget i energistofskiftet veje, herunder fedtsyre metabolisme, pentose og glucuronat indbyrdes omdannelser samt stivelse og saccharose metabolisme. Det har vist sig, at kosten har en vigtig effekt på CRC udvikling. Vores konklusion er helt i overensstemmelse med, at genetiske polymorfier der påvirker metabolismen af ​​næringsstoffer spiller en vigtig rolle i ætiologien af ​​CRC og kolorektale adenomatøs polypose [62].

Flere linjer af beviser har angivet konsekvenserne eller inddragelse af fedt i ætiologien af ​​CRC [66]. Den afgørende rolle, som fedtsyrer i talrige biologiske processer tyder på, at ændringer i fedtsyre metabolizing gener bidrager til kolon carcinogenese [67]. Det har vist sig, at stivelse og sucrose metabolisme og pentose og glucuronateinterconversions blev tæt knyttet til kræft. Christensen et al. [68] viste, at stivelse og saccharose metabolisme og pentose og glucuronateinterconversions pathway blev hypomethylated i isocitratdehydrogenase mutant tumorer. Desuden blev fundet disse to metaboliske veje, der skal signifikant relateret til risikoen for at udvikle østrogenreceptor-negative brystkræft [69].

En nylig CRC sygdomsspecifikke transkriptom forskning viste, at stivelse og saccharose metabolisme var en af de 7 fælles syntesevej signifikant differentielt reguleret under anvendelse af to forskellige microarray platforme, herunder Affymetrix HGU133 Plus2.0 array og CRC sygdomsspecifikke array. Desuden blev fedtsyre stofskiftet identificeret som væsentligt forskelligt reguleret vej ved hjælp af kolorektal sygdom specifik array [70].

Seks kandidatgener identificeret af mrmr, NNA og IFS

I denne undersøgelse har vi identificeret følgende seks gener: GUCA2B, PI16, CDH3, SPIB, BEST2, og HMGCLL1. Nedenfor, lad os kort diskutere deres relationer med colorectal cancer.

GUCA2B (uroguanylin) er en endogen aktivator af guanylatcyklase-2C receptor sig at være nedreguleret 8-fold i adenom, og dens udtryk er påvist i blod og urin [71] .Derfor, GUCA2B kunne betragtes som en ikke-invasiv biomarkør for tidlig påvisning af CRC. Derudover radiomærkede uroguanylin analoger er blevet anvendt til påvisning af CRC in vivo [72].

PI16 (Peptidase inhibitor 16) detekteres i testiklerne, prostata, tyndtarm, colon og ovarie med immunhistokemisk analyser [73]. Nedsættelse af PI16 niveau blev påvist i prostatakræft [73] og gastrisk kræft [74]. Vores resultat viste også, at ekspressionen af ​​PI16 i colorektal adenocarcinom var signifikant reduceret sammenlignet med den tilstødende ikke-tumor colorectal væv, hvilket var i overensstemmelse med resultatet af forskningen i prostatakræft og mavekræft. Da PI16 ikke er godt karakteriseret, og indtil videre er der ingen rapport overhovedet om PI16 i kolorektal cancer ætiologi vores resultat underforstået, at PI16 kan blive en lovende biomarkør for kolorektal cancer tidlig diagnose.

CDH3 er en klassisk cadherin, den demethylering af som ofte detekteres i den avancerede CRC der var forbundet med overekspression af CDH3 [75]. Udover CRC blev CDH3 også overudtrykt i de fleste pancreascancer og gastrisk cancer, men ikke i deres noncancerous modstykker eller i normale væv. Således blev CDH3 betragtet som en ny tumor-associeret antigen nyttig til immunterapi og tidlig diagnosticering af mavekræft og CRC [76].

SPIB er en transkriptionsfaktor af E-seksogtyve (ETS) -familien, som er kendt for at virke som positive eller negative regulatorer af genekspression. SPIB er en adenom tilstandsspecifikke ned reguleret gen og dets ekspression undergik en slående fald i CRC væv indikerer, at SPIB kan tjene som potentielle markører for CRC invasionsevne og metastase [77].

BEST2 (også kendt som VMD2L1) koder for et protein ifølge bestrophin familien. Både RT-PCR-analyser og X-gal-farvning afslørede vævsbegrænset BEST2 og VMD2L2 rigeligt udtrykt i colon [78], [79]. Det har været viser, at BEST2 medierer bicarbonat transport af slimceller i muse colon [80]. Straub et al. [81] identificeres BEST2 som en af ​​methylering markører for tidlig påvisning og prognose af CRC. Derfor BEST2 var forventet at blive en terapi mål for CRC med demethylering agent.

HMGCLL1 har været show at være relateret til forskellige kræftformer, såsom pancreascancer [82], glioblastoma multiforme [83], bryst og tyk- kræft [84]. HMGCLL1 er et af generne, der indeholder somatiske mutationer i pancreascancer [82]. Selvom mutation i HMGCLL1 er blevet rapporteret at være involveret i disse kræftformer, de specifikke mekanismer bag mangler at blive belyst.

korteste vej gener

Vi er helt identificeret 35 korteste stier gener. Som vi kan se af tabel 2, nogle korteste vej gener såsom TP53, EP300, CTNNB1 og GSK3b var ikke signifikant for CRC på grund af deres universelle i talrige kræftformer. Imidlertid har disse gener er veldokumenteret at være relevante for CRC, og også deres rolle i CRC er blevet godt karakteriseret [85]. Udover disse gener, de fleste af de andre korteste gener opført i tabel 2 var helt specifikke for CRC (p-værdi 0,05). Nedenfor, lad os fokusere på de specifikke gener med de store betweenness værdier og diskutere forholdet mellem sådanne gener med CRC.

AR (androgen receptor) er en ligand afhængig transskription faktor, som er involveret i kontrollen af ​​cellulære proliferation og differentiering [86]. Flere undersøgelser har givet understøttende beviser for sin involvering af sex steroidhormoner (østrogener og androgener) i ætiologien og progression af CRC [87]. AR-protein har vist sig at blive udtrykt i normal colorektal mucosa og i de fleste kolorektal cancer [61], [62], at støtte, at CRC udtrykker AR receptoren kan reagere på mitogene virkninger af hormonet. Desuden somatiske reduktioner af androgen receptor CAG repeat forekommer hyppigt, gennem en sti forskellig fra mikrosatellit ustabilitet og tidligt under kolon carcinogenese. Tilsyneladende vækst selektion af celler, der huser forkortede AR alleler viser, at androgener bidrage til colon carcinogenese i en endnu ukendt måde [61].

TBP (TATA-bindende protein) er en vigtig eukaryot transkriptionsfaktor bruges af alle tre cellulære RNA-polymeraser.

Be the first to comment

Leave a Reply