PLoS ONE: Chip-seq Defineret Genom-Wide Kort over TGFp /Smad4 Mål: Konsekvenser med Klinisk Resultatet af æggestokkene Cancer

Abstrakt

Deregulering af den transformerende vækstfaktor-β (TGF) signalvejen i epitelial ovariecancer kræft er blevet rapporteret, men den præcise mekanisme underliggende forstyrret TGF signalering i sygdommen er fortsat uklart. Vi udførte chromatin immunoprecipitation efterfulgt af sekventering (chip-seq) at undersøge hele genomet screening af TGFp-induceret Smad4 bindende i epitelial ovariecancer. Efter TGFp stimulering af A2780 epitelial ovariecancer cellelinje, vi identificeret 2,362 Smad4 bindende loci og 318 differentielt udtrykte Smad4 målgener. Omfattende undersøgelse af Smad4-bundne loci, afslørede fire forskellige bindende mønstre: 1) Basal; 2) Shift; 3) Stimuleret Kun; 4) Ustimulerede Only. TGFp stimuleret Smad4-bundne loci primært klassificeret som enten kun stimuleret (74%) eller Shift (25%), hvilket indikerer, at TGF-stimulation ændrer Smad4 bindende mønstre i epitelial kræft i æggestokkene celler. Desuden er baseret på gen-regulatoriske netværksanalyse, vi fastslået, at TGF-induceret, Smad4-afhængige regulerende netværk var markant anderledes i kræft i æggestokkene i forhold til normale celler. Vigtigt er det, de TGFp /Smad4 målgener identificeret i A2780 epitelial kræft i æggestokkene cellelinje var prædiktive for patientens overlevelse, baseret på in silico udvinding af offentligt tilgængelige patientdata databaser. Afslutningsvis vores data fremhæve nytten af ​​næste generations sekventering teknologi til at identificere genom-dækkende Smad4 målgener i epitelial kræft i æggestokkene og linke afvigende TGFp /SMAD signalering til æggestokkene tumorigenese. Desuden identificerede Smad4 bindende loci, kombineret med genekspression profilering og i silico data mining af patientkohorter, kan give en kraftig tilgang til at bestemme potentielle gen signaturer med biologiske og fremtidig translationel forskning i æggestokkene og andre kræftformer.

Henvisning: Kennedy BA, Deatherage DE, Gu F, Tang B, Chan Mwy, Nephew KP, et al. (2011) chip-seq Defineret Genom-Wide Kort over TGFp /Smad4 Mål: Konsekvenser med Klinisk Resultatet af kræft i æggestokkene. PLoS ONE 6 (7): e22606. doi: 10,1371 /journal.pone.0022606

Redaktør: Patrick Tan, Duke-National University of Singapore Graduate Medical School, Singapore

Modtaget: Februar 22, 2011; Accepteret: 26 jun 2011; Udgivet: 25 Jul 2011

Copyright: © 2011 Kennedy et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Denne undersøgelse blev støttet af tilskud fra National Institutes of Health U54CA113001, R01CA069065 og National Cancer Institute CA85289 og ved midler fra Ohio State University Comprehensive Cancer center og The Ohio State University Biomedical Informatics. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

transformerende vækstfaktor-β (TGFp) signalvejen spiller en vigtig rolle i kontrollen proliferation, differentiering og andre cellulære processer, herunder væksten af ​​æggestokkene overflade epitelcelle (OSE) [1], [2]. Dysregulering af TGFp signalering er ofte observeret i epitelial ovariecancer (EOC) og kan være afgørende for EOC udvikling [3], [4]. Virkningerne af TGFp medieres af tre TGFp ligander – TGFp1, TGFβ2 og TGFβ3, der handler gennem TGFp type 1 og type 2-receptorer [5] – [7]. TGFBR2 er den specifikke receptor for TGFp ligander. Den funktionelle receptor-komplekset regulerer aktiveringen af ​​nedstrøms Smad og ikke Smad pathways [8]. Det phosphorylerede type 1 receptor rekrutter og phosphorylerer receptor-regulerede Smads R-Smads). Af de fem R-Smads i pattedyr, den TGFBR2-ALK5 kompleks aktiverer SMAD2 og SMAD3, mens TGFBR2-ALK1 kompleks aktiverer SMAD1, SMAD5 og SMAD8 [9]. Aktiverede R-Smads danner heteromerkomplekser med den fælles partner Smad (co-Smad, Smad4 i pattedyr) og translokere ind i kernen [6]. Som affiniteten af ​​det aktiverede Smad komplekset for Smad-bindende element er utilstrækkelige til at understøtte association med endogene promotorer af målgener, skal Smad komplekser associere med andre DNA bindende transkriptionsfaktorer for at regulere ekspression [7]. Talrige undersøgelser har vist, at forskellige familier af transkriptionsfaktorer, såsom forkhead, homeobox, zinkfinger, LEF1, Ets, og grundlæggende helix-loop-helix (bHLH) familier, kan tjene som Smad4 partner proteiner til at opnå høj affinitet og selektivitet for target promotorer med passende bindende elementer [10] – [14].

A2780 humane epitelial ovariecancer cellelinje er følsom over for cis-diammindichlorplatin (II) (cisplatin), en af ​​platin-type midler ( carbolatin eller cisplatin) anvendes i behandlingen af ​​ovariecancer. Ud over at fungere som en nyttig model til undersøgelse af lægemiddel-sensitive sygdom, A2780 celler udviser delvis TGFp dysregulering, angivet med kun en beskeden stigning i Smad4 ekspression og transduktion af eksisterende Smad4 fra cytoplasmaet til cellekernen efter TGFp-stimulering [15]. Således er denne cellelinie er også en passende model-system til at udføre genom-dækkende kortlægning af Smad4 målgener og identificere de deregulerede TGF /Smad4 målgener og veje impliceret i æggestokkene kræftpatienter.

Seneste sammenligninger af spån- seq (kromatin immunofældning-sekventering) til array-tilgange tydeligt vist, at chip-seq teknologi gav højere opløsning, større dybde og forbedret kortlægning nøjagtighed transskriptionsfaktorbindende og histon modifikationer på et genom-plan [16] – [18]. I den aktuelle undersøgelse, brugte vi chip-seq teknologi til at studere TGFp /Smad4 regulering i platinsensitiv A2780 æggestokkræft cellelinje. Vi profileret Smad4 bindende loci følgende med TGFp-stimulering. Brug af beregningsmæssige metoder, har vi undersøgt Smad4 bindende mønster og sammenlignede den med den Smad4 bindende mønster af både en normal immortaliseret ovarie overflade epitheilial celle (IOSE) fra vores tidligere undersøgelse [12] og humane keratinocytter (HaCaT) fra Koinuma et al [11 ]. Endvidere genererede vi TGFp /Smad4-regulerede gen signaturer og udnyttet en

i silico

minedrift tilgang til at korrelere de identificerede signaturer med kliniske outcome data fra to offentligt tilgængelige ovariecancer patientkohorter. Vores integrativ tilgang afsløret betydelige sammenslutninger af TGF /Smad4 regulerende net med både progressionsfri og samlet overlevelse hos patienter med ovariecancer. Ved at identificere tusindvis af Smad4 bindende loci samt regulerede gener, vore data giver både en ny ressource til at studere mekanismen bag fejlreguleret TGFp signalering i æggestokkene cancerceller samt potentielle prognostiske biomarkører for fremtidig ovariecancer translationel forskning.

Resultater

genom-Wide Smad4 belægning defineret af chip-seq teknologi

Vores tidligere undersøgelser [12], [15], [19], [20] og andre [2], [ ,,,0],4], [21] – [23] har forsøgt at etablere og karakterisere de molekylære mekanismer i fejlreguleret TGFp-medieret signalering i ovariecancerceller og erhvervede cisplatin-resistente ovariecancerceller. For yderligere at belyse nærmere oplysninger om de underliggende mekanismer, brugte vi chip-seq teknologi til at identificere de genomiske steder bundet af Smad4 i A2780 celler før og efter TGF stimulering.

Brug chip-seq, alle prøver var oprindeligt sekventeret at generere et sæt af rå læser (hver læsning har en længde på 36 bp) fra Illumina /Solexa GAII systemet (tabel S1) i området fra ~43 millioner til ~51 mio læser per prøve. Efter kortlægning til UCSC Menneskelig HG18 forsamling, et sæt af ~26 millioner og ~32 millioner kortlagt læser med blev opnået unikke genomiske steder for Ustimulerede A2780 og TGF-stimuleret A2780 hhv. Vi anvendte derefter vores peak-kald afsløring program, BELT, [24], [25] (se materialer og metoder) til at identificere den bindende loci af Smad4 i disse to betingelser. Kort beskrevet vores bælte program bruger en percentil scoring metode til bestemmelse af berigelse tærskelværdi for hver af de øverste fraktiler fra alle bindende regioner, efterfulgt af identifikation af antallet af bindende loci ved hver percentil niveau. For at bestemme betydningen af ​​hver percentil, et sæt af tilfældigt simuleret læsninger anvendes som baggrund at estimere den falske opdagelse sats (FDR). Vores Chip-seq data bekræftede flere Smad4 bindende loci tidligere identificerede i forskellige væv og celletyper, herunder Gadd45A, CTGF, JAG1, LEMD3 [14], MYC [26], EDN1, RYBP, DST, og BCAT1 [11].

basal belægning.

Vi identificerede 2009 Smad4 bindende loci i det basale (ikke-stimulerede) tilstand i A2780 cellelinje (tabel S1). Vi fandt, at 1.499 (74,6%) loci var placeret inden for +/- 100 kb af en kendt RefSeq gen [27]. Overraskende, kun lille del (267 1499 13,3%) var inden promotorregionen (+/- 8 kb), af et gen, mens størstedelen af ​​bindende loci var enten 10 kb opstrøms for 5’TSS eller 10 kb nedstrøms 3 ‘TSS (figur 1A – rød linje). Denne fordomsfri hele genomet bred placering analyse foreslog, at mange andre tidligere genom-dækkende undersøgelser baseret på promotor chip-chip-teknologi [11], [12], [28], kan kun identificere undergrupper af Smad4 målgener.

A ) fordelingen af ​​placeringen af ​​Smad4 bindende loci i et histogram plot baseret på deres forhold til en nærmeste kendte RefGene 5’TSS. B) Klassifikation af Smad4 bindende loci i fire bindende mønstre. Stimuleret Kun bindende loci er dem, hvis forbundet RefGene har bindende loci kun i den stimulerede sæt, ligeledes for Ustimulerede kun. Shift bindende loci har en bindende loci optræder på samme gen i begge forhold, og de er større end 1000 nt fra hinanden. Basal bindende loci vises på det samme gen i begge forhold, men de er mindre end 1000 nt fra hinanden. C) Et skærmbillede viser LRRC17 bindende mønster, hvor Smad4 binder til 5’TSS af LRRC17 efter TGFp stimulering, er kategoriseret til stimuleret Kun Binding. D) Overflod af DNA efter Smad4 ChIP trække ned i forhold til tilstedeværende DNA følgende træk ned med uspecifik IgG antistof som bestemt ved kvantitativ syber grøn PCR. U og S bruges til at repræsentere de stimulerede og stimuleret bindende regioner i SLC40A1 hhv. * Repræsenterer et t-test p-værdi på mindre end 0,05 og betegner signifikant berigelse i forhold til IgG kontrol.

TGFp-stimuleret binding.

Ved stimulation med TGFp, 2362 Smad4 binding loci blev identificeret (tabel S1). Samlet, fordelingen af ​​placeringen af ​​Smad4 bindende loci efter TGFp stimulering er meget lig den, før stimulering (figur 1A – sort linje for stimuleret og rød linje for ustimuleret). Men de bindende mønstre mellem to betingelser (før og efter TGFp stimulation) er dramatisk anderledes (figur 1B). Vi fjernede først disse bindende loci placeret langt væk fra enhver kendte RefSeq gener (+/- 100 kb) og derefter klassificeret dem (1723 loci for stimuleret og 1499 loci for ustimuleret) i fire forskellige bindende mønstre: 1) Basal Bindende – to bindende loci er forbundet med samme gen og inden for 1 kb afstand af hinanden (dvs. uændret binding); 2) Shift Binding – to bindende loci er forbundet med samme gen under begge betingelser, men de er mere end 1 kb fra hinanden; 3) Stimuleret Kun Binding – en bindende loci forbundet med et gen kun i den stimulerede tilstand; 4) Ustimulerede Kun Indbinding – en bindende loci forbundet med et gen kun i den ustimulerede tilstand. På baggrund af ovenstående klassificering, vi konstateret, at 74,2% (1279 af 1723) og 73,5% (1102 af 1499) af de bindende loci var i Stimuleret Kun Bogbinding og stimulerede Kun Bindende kategorier hhv. Mens 24,8% (429 af 1723) og 25,5 (382 af 1499) bindende loci blev klassificeret i Shift Bindende kategori for den stimulerede og ustimulerede tilstand henholdsvis kun 15 bindende loci i hver tilstand (0,9% og 1,0% henholdsvis) faldt i Basal Bindende kategori. Vores genomiske kortlægning Resultaterne viste, at TGF stimulering af æggestokkene cancerceller kan ændre landskabet af Smad4 bindende mønstre. En komplet liste over klassificerede bindende mønstre er vist i tabel S2.

Endvidere for at verificere, at TGF stimulering resulterede i de bindende ændringer, vi observerede i chippen-seq data, valgte vi tilfældigt et sæt af 22 mål identificeret ved vores analyse og udført chip-qPCR anvendelse af DNA isoleret fra en immunopræcipitation, der var adskilt fra DNA’et bruges af chip-seq. Vores chip-qPCR valideringer ikke kun bekræftet de mål identificeret i chippen-seq data, men også yderligere vist, at den aktiverede eksogene TGF signalering er i stand til at producere drastiske ændringer i Smad4 bindende mønstre (figur 1C, 1D og figur S1A, B).

Regulering af TGFp-stimuleret Smad4 målgenekspression i A2780

Dernæst udførte vi genekspression microarrays at bestemme ekspressionen status for Smad4 målgener efter TGFp stimulering. A2780 mRNA fra tre uafhængige biologiske gentagelser af både før og efter 3 timers TGFp stimulering blev fremstillet og analyseret på Affymetrix U133 Plus 2 Platform. Samlet set blev 3.191 gener identificeret som værende markant op eller ned-reguleret efter TGFp stimulering med mindst 0,5 log2-gange ændring i udtryk og p-værdi på mindre end 0,1 (figur 2A). Efter at have undersøgt sammenhængen med 1.443 TGFp-stimuleret Smad4 målgener (svarende til 1723 Smad4 bindende loci i den stimulerede tilstand), et flertal (2873 af 3191) af gener med differentiel udtryk i A2780 overraskende manglede Smad4 bindende loci, hvor 318 gener havde på mindst en Smad4 bindende loci og viste mindst en 0,5 log 2-fold ekspression ændring efter 3 timers TGF-stimulering (figur 2B). Nærmere oplysninger om 3.191 signifikant differentielt udtrykte gener er tilgængelige i tabel S4 og 318 gener i tabel S5.

A) En Heatmap af udtrykket fold ændringer for gener mellem den ustimulerede og TGFp stimuleret tilstand, der viser tre gruppe af gener , opreguleret, ingen ændring, og nedreguleres. Op og ned regulerede gener er defineret som havende en log2 gange ændring på mere end 0,5 eller mindre end -0.5 hhv. B) En sammenligning mellem de gener med Smad4 bindende loci (1443) i TGFp stimuleret tilstand med alle gener, der viser forskellen udtryk (3193), som viser tre forskellige grupper, dem med differential udtryk og ingen Smad4 bindende loci, dem uden differential udtryk og en Smad4 bindende loci og dem med begge. C) GO anmærkninger for de tre forskellige gruppe gener, der viser i Venn-diagram (B). D) RNA ekspressionsniveau som bestemt ved QRT-PCR forhold til GAPDH ekspressionsniveauer. Eksperimenter blev udført i biologisk triplo. * Betegner en t-test p-værdi på mindre end 0,05 og betegner signifikant forskel i ekspression mellem ustimulerede og stimulerede betingelser.

Gene ontologi analyse viste, at de differentielt udtrykte gener med Smad4 bindende loci var signifikant beriget for gener involveret med celle del morfogenese og udviklingsmæssige proteiner (Figur 2C-Gene Loci), i overensstemmelse med de tidligere undersøgelser i forskellige celletyper [12], [36]. Vi fandt også, Smad4 bindende associerede gener mangler differentiel ekspression blev beriget for gener med EGF-lignende domæne og polymorfi antyder, at forskellige signalveje kan mediere andre end TGFp signalering (kun figur 2C-loci) Smad4 funktioner, mens den store sæt af differentielt udtrykt gener mangler Smad4 bindende loci var involveret i immune funktioner og proteinholdige ekstracellulære matrix. Efter at have undersøgt en mere constraint p-værdi på 0,05 og fold ændring på 0,5 for TGFp stimulerede differentielt udtrykte gener, opnåede vi et sæt af 1763 gener. Af disse gener, fandt vi 184 (10,4%) gener at have mindst én TGFp stimuleret Smad4-bindingssted (tabel S6). Denne procentdel er meget lig datasættet hvoraf 318 (10%) af 3191 differentielt udtrykte gener har mindst en TGFp stimuleret Smad4-bindingssted (tabel S5). GO-funktionen analysen var også meget ens i top kategorier (Figur S2). For yderligere at bekræfte differentiale udtrykt Smad4 målrettede gener som følge af TGF stimulering, valgte vi tilfældigt et sæt af 18 targets identificeret af vores analyse og udført en RT-qPCR. Mere end 70% (13 af 18) gener blev valideret ved RT-qPCR som vist i figur 2D og fig S3. En liste over designede primere er vist i tabel S7.

Smad4-afhængige gen regulerende net i TGFp-inducerede ovariecancerceller

Vores tidligere undersøgelse [12], og en undersøgelse fra Koinuma et al [ ,,,0],11] har identificeret et sæt af 150 TGFp stimuleret Smad4 målgener i IOSE (en udødeliggjort ovarie overflade epitelcellelinie) og et sæt af 92 TGFp stimuleret Smad4 målgener i HaCaT (en udødeliggjort keratinocytcellelinje). Det var ikke overraskende at finde begrænset overlap på kun 6 af 150 i IOSE, 6 af 92 i HaCaT, og 1 for alle tre undersøgelser fælles med de 318 Smad4 målgener i denne undersøgelse (figur 3A) som kun én, A2780, er en cancercellelinie og de to andre er normale cellelinier. En anden mulighed for sådanne lave overlappende satser er, at det kan skyldes de begrænsede mål identificeret ved anvendelse promotor-array (chip-promotor-chip). GO analyse [29] viste også målgener i HaCaT og IOSE var primært involveret i regulering af celleproliferation (eller anti-apoptose) og udviklingsproces (muskelfylde), der var forskellige fra målgener i A2780 (figur 3B).

A) En Venn-diagram viser sammenligningen af ​​TGFp /Smad4 målgener i tre forskellige celletyper. B) GO anmærkninger for de unikke gener for hver celletype.

For yderligere at sammenligne forskellen i TGF-stimulerede Smad4-afhængige gen lovgivningsmæssige oplysninger mellem disse tre celletyper, vi anvendte en beregningsmæssige analytisk tilgang vi tidligere udviklet [30] for at bygge Smad4-afhængige regulerede netværk i HaCaT, IOSE, og A2780, henholdsvis (figur 4). Kort fortalt vores beregningsmæssige analytisk tilgang startede med CHIP baserede dataserier og genekspression data. Hver Smad4 bindende loci wa tilpasset kendes en RefSeq gen ID som derefter blev undersøges for differentiel genekspression. Et sæt af differentielt udtrykte Smad4 målgener efter TGF stimulering blev yderligere bruges til at finde den mest betydningsfulde transskription faktor (TF) bindende partnere ved at ChIPMotifs [31] eller ChIPModudles [32], som blev brugt som Hub TF’er. Hub TF-gen-forbindelse blev bestemt ved scanning af Hub TFS ‘PWM’er i alle bindende loci og en permutation test blev anvendt til at teste pålideligheden af ​​hver forbindelse i netværket. Det resulterede regulatoriske netværk blev visualiseret ved Cytoscape [33].

Vi identificerede seks Hub TFS GFI1, NR3C1, SOX17, STAT4, ZNF354C, og TCF8 fra 318 Smad4-afhængige målgener i A2780 celler, mens fire Hub TF’er, LEF1 (TCF), Elk1, COUPTF (NR2F5), og E2F, blev identificeret i IOSE celler ved vores tidligere forsøg med en lignende tilgang (CART model) [12]. Vores beregningsmæssige analytisk tilgang identificerede også tre Hub TF’er, E2F1, SP1, og USF, for 92 Smad4-afhængige målgener i HaCaT celler, som var meget lig de TF motiver identificeret fra Koinuma et al. undersøgelse [11]. Den øverste motiv rapporteret i deres undersøgelse, AP1, var savnet i vores resultater ved at benytte en avanceret klassifikation algoritme i vores ChIPModules [32], og at være i stand til at fjerne disse TF motiver som også beriget med tilfældige sæt. Interessant, vi fandt også en Hub TF E2F (E2F1) var fælles mellem de to normale celler, men ikke til fælles med A2780-celler. Sammen med GO funktionsanalyse, vores resultater indikerede, at E2F kan optræde som en stor Smad4 co-transkriptionsfaktor partner i mediering af celleproliferation i normale celler, men tabte i carcinomceller. De regulatoriske netværk resulterende gen (GRN) for alle tre celler er vist i figur 4. Generelt vores gen tilsynsnetværk analyse viser stærkt, at TGFp stimulerer en anden Smad4-afhængig reguleringsmekanisme i ovariecancerceller sammenlignet med normale celler, dvs. Smad4 regulering netværk er blevet “rewired” i æggestokkene cancerceller.

Gene underskrifter udvælgelse og klinisk resultat

En af de lovende potentielle anvendelser af genom-dækkende “omik undersøgelser med anvendelse af cellelinje-systemer er identifikation af gen signaturer, der kan give bedre prognostisk information sammenlignet med standard kliniske og patologiske parametre [34], [35]. For at løse forholdet mellem TGFp stimuleret Smad4-afhængige målgener og klinisk resultat af patienter med ovariecancer, vi undersøgte de 307 målgener identificeret i A2780 celler i denne undersøgelse, som ikke blev identificeret i tidligere undersøgelser af normale celler, i to forskellige kliniske æggestokkene kræft kohortestudier, der havde indberettet overlevelsesdata [36], [37]. Vi først klassificeret patienterne i forskellige undergrupper, baseret på deres gen underskrifter, og derefter korreleret dataene med patienten overlevelse oplysninger. Ved minedrift 153 patient kohorte fra Bild et al [36], var vi i stand til at bruge de 187 af 307 gener identificeret i genekspression datasæt til at anvende den hierarkiske clustering metoden med distance-baserede foranstaltninger fra en trial-and-error perspektiv og klassificere generne i fire gen grupper (figur 5A). For hver af de fire gen grupper, vi yderligere grupperet de 153 prøver i fire patientgrupper (PG, figur 5B), og korreleret PG med deres overlevelse information. Af 153 patienter, kun 124 har fuldstændig overlevelse oplysninger, blev således yderligere anvendt for overlevelse kurve plots. Vi fandt, at en underskrift af en delmængde af 49 gener (G2 gen gruppe), der var i stand til at forudsige en væsentlig overlevelse korrelation for 62 af patienterne med en p-værdi på 0,0471 (figur 5C, D). Specifikt PG: 4 (25 patienter) viste dårlig median overlevelse på 31 måneder sammenlignet med PG: 3 (37 patienter), med en median overlevelse på 63 måneder. En overlevelse kurve plot for to patientgrupper, PG: 3 og PG: 4 ved hjælp af en tilfældigt udvalgt 49 gener (hvor de ikke er inden for 49 G2 gener) viste en log-rank test p-værdi på 0,1558 (figur 5E). På grund af begrænset patologiske oplysninger til rådighed for denne patient kohorte, var vi ikke i stand til væsentligt korrelere vores gen underskrifter med andre kliniske resultater. Men en særlig høj procentdel af trin IV patienter samlet i PG3 mens al scenen IC og to fase IIC patienter samlet i PG4 trods et lignende antal stadie IIIC patienter i hver (tabel S8), måske indikerer, at TGF /Smad4 regulerede gener kunne være potentielt anvendes til at klassificere en undertype af patienter med ovariecancer.

a) Den hierarkiske klyngedannelse resultat af de 187 gener i fire gen grupper, nemlig G1, G2, G3 og G4. Den lodrette akse repræsenterer genklynger (187 gener) og den horisontale akse står for forskellige prøver (153 patienter). B) Den hierarkiske klyngedannelse resultat af de 153 patienter i fire patientgrupper, nemlig PG: 1, PG: 2, PG: 3 og PG: 4 ved hjælp G2 gruppe på 49 gener. C) Overlevelse kurve plot for G2 gen gruppen. Den vandrette akse repræsenterer overlevelse måneder og lodret for procent overlevelse (%) inden den tilsvarende patientgruppe. Fuldstændig fire patientgrupper, dvs. PG: 1, PG: 2, PG: 3 og PG: 4 analyseres for G2-genet gruppen. D) En detaljeret overlevelse kurve plot for to patientgrupper, PG: 3 og PG: 4, der viser en betydelig log-rank test p-værdi på 0.0471.E) En overlevelse kurve plot for to patientgrupper, PG: 3 og PG: 4 ved hjælp af en tilfældigt udvalgt 49 gener (hvor de ikke er inden for 49 G2 gener), der viser log-rank test p-værdien er 0,1558.

Når vi anvendt den samme

i silico

minedrift tilgang til den anden patient kohorte fra Lu et al [37], (bestående af 42 patienter og 5 normale personer), viste resultaterne, at et gen underskrift 19 af de 307 gener forudsagt bedre overlevelsesrater for PG4 og Normals end andre PG’er med en p-værdi på 0,0078 (figur S4).

diskussion

Vi har for første gang anvendt chip-seq teknologi til hel-genom-dækkende kortlægning af TGF-stimuleret, SMAD4- afhængige regulerede gener i en ovariecancer cellelinje (A2780). Vore data viser, at sammenlignet med den basale tilstand (ingen TGFp stimulation), et flertal af Smad4 bindende loci er enten nyligt bundet til kromatin (74,2%) eller forskudt bundet (24,8%) efter TGFp stimulering, hvilket tyder TGFp stimulerede cancerceller kan ændre landskab af Smad4 bindende mønstre. Endvidere vores GO analyse viste slående ligheder mellem de øverste 10 GO kategorier 1.443 og 1.316 Smad4 målgener i stimuleret og Ustimulerede betingelser (data ikke vist). Men 318 differentielt udtrykte gener, der indeholder mindst et stimuleret Smad4 bindende loci, var signifikant beriget for mere specifikke GO vilkår, såsom celle del morfogenese og udviklingsmæssige proteiner. Dette resultat indikerer, Smad4 kan regulere et meget specifikt sæt af målgener som reaktion på TGF-signalering, for at lette specifikke funktioner i denne celletype gennem denne særlige signalvej. Faktisk GO analyse for Smad4 målgener uden genekspression niveau ændringer efter TGF stimulering fundet en af ​​de berigede gen kategorier er ‘EGF ligesom signalering’, hvilket giver yderligere beviser for, at andre signalveje kan modulere Smad4-afhængige regulerede gener i kræft i æggestokkene. Et eksempel herpå kan være de knoglemorfogenetiske proteiner (BMP’er), som også er opstrøms for Smad4 og kan således være i stand til at regulere nogle af disse Smad4 målgener. BMP’er har vist sig at være vigtige regulatorer af æggestokkene fysiologi og involveret i ovarieudvikling og andre kræftformer [38] – [40]. I fremtidige studier bidrag af hver signalveje ‘regulering af de identificerede Smad4 målgener vil forsøge at blive flertydig

I lighed med andre resultater for transkriptionsfaktorer, herunder østrogen receptor alpha (ERa) [41] -. [43 ], androgen receptor (AR) [44], og peroxisomproliferatoraktiveret receptor (PPAR) [45], observerede vi, at et flertal ( 70%) af Smad4 bindende loci placeret mere end 8 kb væk fra 5’TSS af en kendt RefSeq gen. Dette kunne tyde på TGFp bindende loci kommer i umiddelbar nærhed af promotoren gennem kromosom looping upon TGFp stimulering. Interessant nok vores

de novo

motiv identificerede også en SMAD-lignende motiv i et sæt af 5-distal binding loci, men ikke i et sæt af 5′-promotor-loci (data ikke vist). Vores genom-dækkende placering analyse peger også betydningen af ​​hel-genom-dækkende sekventering teknologier, som vi viste mange bindende loci er langt væk fra 5’TSS af en kendt gen og derfor en promotor-array-teknologi kan brænde mange mål bindende loci af en transkriptionsfaktor. Vores fremtidige studier vil fokusere på at gennemføre chip-3C-qPCR at bekræfte, om disse distale bindende loci er faktisk relateret til disse særlige gener, potentielt afdække den underliggende mekanisme af TGF /Smad4 medieret genregulering.

Et vigtigt aspekt af denne undersøgelse er brugen af ​​

in silico

udvinding af offentligt tilgængelige patientdata kohortedata at identificere en undergruppe af TGFp /Smad4 målgener som et gen signatur til forudsigelse kliniske (overlevelse) resultater. Så vidt vi ved, er dette den første undersøgelse for at forsøge at bruge TGFp signalering responsive Smad4 regulerede gener at klassificere æggestokkene kræftpatienter i forskellige undertyper af patientgrupper, samt forudsige dårlig overlevelse fra gode overlevelse populationer med statistisk signifikans (figur 5). Således kombinerer chip-seq identificeret bindende loci, genekspression profilering, og en

i silico

udvinding af patientkohorter kan give en kraftfuld metode til at identificere potentielle gen signaturer med biologisk og klinisk betydning.

Afslutningsvis vores undersøgelse giver den første omfattende hele genomet kort over tusindvis af TGFp /Smad4 mål i en ovariecancer cellelinie, som yderligere kan anvendes til at studere Smad4 funktioner i tumorigenese. Til vores viden, er dette den første undersøgelse for at linke TGFp /Smad4 regulerede gener til klinisk information om kræft i æggestokkene patient overlevelse og identificere potentielle gen signaturer til prognosen i kræft i æggestokkene. I vores fremtidige studier, vil vi

Materialer og metoder

Celledyrkning og TGFp stimulering

A2780 celler [15] blev dyrket i RPMI 1640 (Invitrogen, Carlsbad, CA) suppleret med 10% føtalt bovint serum i en CO 37 ° 5%

2 incubator. Før TGFp stimulering blev cellerne delt ved -70% konfluens og inspiceres dagligt. For chip, blev 80% konfluente celler optimalt stimuleret med 10 ng /ml rekombinant TGFp1 (Sigma, St. Louis, MO) i 1 time før formaldehyd tværbinding mens ekspression analyse blev udført efter 3 timers stimulering med 10 ng /ml TGFp1.

chromatin immunopræcipitation og massiv parallel sekventering

kromatin immunofældning (chip) blev udført som beskrevet tidligere [46], [47] med nogle note værdige ændringer. Kort fortalt blev cellerne skyllet med stuetemperatur PBS inden de tværbundet i en 1% formaldehyd-opløsning. Celler blev derefter høstet og homogeniseret i nærvær af proteaseinhibitorer før DNA blev sonikeret. Magnetiske Dynal-perler (Invitrogen) kombineret med en blanding af antistoffer (20% Smad4 # 9515 (Cell Signaling Technology, Danvers, MA) og 80% Smad4 DCS-46 (Santa Cruz Biotechnology, Santa Cruz, CA) blev anvendt til at trække ned Smad4 natten over. Renset DNA blev anvendt til at påvise fold berigelse af Syber Green QRT-PCR se tabel S3 for en liste over primere.

Sequencing biblioteker blev genereret for massiv parallel sekventering ved hjælp af standard metoder. Kort fortalt 500 ng pulldown DNA blev underkastet ende reparation, terminal adenylering, og adaptorligering før fragmenter spænder over ~175-250 blev isoleret fra en 2% E-gel (Invitrogen). Efter en standardiseret 12 cyklus PCR blev DNA kvalitet evalueret på et DNA 1000 Bioanalyzer . chip (Agilent Technologies, Santa Clara, CA), inden de forelægges for sekventering på en Illumina GAII All chip-seq data er deponeret i Gene Expression Omnibus (GEO) database på National center for Biotechnology Information (http: //www.ncbi .nlm.nih.gov /geo) og er accessionsnummer GSE27526.

genekspressionsprofilering

Totalt RNA blev ekstraheret fra celler under anvendelse af Trizol (Invitrogen) for microrarray analyse på en Affymetrix HGU133 Plus 2

Be the first to comment

Leave a Reply