PLoS ONE: En High Resolution Genome Wide Scan af HNF4α Anerkendelse steder udleder en Regulatory Gene netværk i Colon Cancer

Abstrakt

Den hepatiske nukleare faktor HNF4α er en alsidig transskription faktor og styrer udtryk for mange gener i udvikling, stofskifte og sygdom. At afgrænse dets regulerende gen netværk i coloncancer og definere hidtil ukendte genmål en omfattende hele genomet scanning blev udført med en opløsning på 35 bp med kromatin IP DNA opnået fra den humane koloncarcinomcellelinie Caco-2, der er en særlig rig kilde HNF4α. Mere end 90% af HNF4α bindingssteder blev kortlagt som promotor- distale sekvenser mens enhancerelementer kunne defineres for at fremme kromatin sløjfer for interaktion med andre promotor–bundne transkriptionsfaktorer. Sequence motiv analyse af forskellige genetiske algoritmer dokumenteret en unik enhanceosome der bestod af de nukleare proteiner ERa, AP1, GATA og HNF1α som samarbejder transkriptionsfaktorer. Samlet 17.500 DNA-bindende sites blev identificeret med et gen /bindingssted ratio, der afveg 6 gange mellem kromosomer og grupperet i adskilte kromosomale regioner blandt 6600 gener målrettet mod HNF4α. Beviser præsenteres for nuklear receptor krydstale af HNF4α og østrogen receptor α, der er sammenfattet i sekvensen niveau. Bemærkelsesværdigt, Y-kromosomet er blottet for HNF4α bindingssteder. Den funktionelle betydning berigelse sites blev bekræftet i genom-dækkende genekspressionsstudier ved varierende HNF4α protein niveauer. Taget under ét, er en genom-dækkende scanning af HNF4α bindingssteder rapporteret for bedre at forstå de grundlæggende mekanismer for transkriptionel kontrol af HNF4α målrettede gener. Novel promoter distale bindingssteder er identificeret som udgør en enhanceosome derved lette RNA forarbejdning begivenheder

Henvisning:. Weltmeier F, Borlak J (2011) A High Resolution Genome Wide Scan af HNF4α Anerkendelse steder udleder en Regulatory Gene netværk i Tyktarmskræft. PLoS ONE 6 (7): e21667. doi: 10,1371 /journal.pone.0021667

Redaktør: Ying Xu, University of Georgia, USA

Modtaget: Februar 2, 2011; Accepteret: 6 Juni 2011; Udgivet: 28 juli, 2011

Copyright: © 2011 Weltmeier, Borlak. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev finansieret af Niedersachsen ministerium for kultur og videnskab og Volkswagen fundament, Tyskland. Grant nummer: 25A.5-7251-99-3 /00. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Nedsat nuklear faktor HNF4α er medlem af den nukleare receptorsuperfamilie og et yderst alsidigt transskriptionsfaktor [1]. Denne zinkfinger-proteinet udtrykkes i lever, tarm, bugspytkirtel og andre væv, og binder til beslægtede DNA-sekvenser som en homodimer [2]. Tidligere blev der rapporteret nogle dusin promoter bindingssteder. Anvendelsen af ​​kromatin immunofældning og microarray hybridiseringsbetingelser chip-chip metoder viste, at disse er kun den mindste del af de faktiske HNF4α bindingssteder. Ved anvendelse af flisebelægning arrayet omfatter de encode regioner, der udgør 1% af genomet i den humane hepatoma-cellelinie HepG2 [3] i alt 194 HNF4α bindingssteder kan kortlægges. I en anden undersøgelse HNF4α bindingssteder i hepatocytter og pancreas-øer blev kortlagt, men den fremgangsmåde fokuseret på promotorregioner kun [4]. Som i dag, har et genom-dækkende fodaftryk HNF4α ikke blevet rapporteret. Især HNF4α er en master regulatorisk protein og dysfunktion af HNF4α er blevet forbundet med metaboliske og kræftsygdomme. Vi var især interesseret i at udforske en HNF4α genomisk fodaftryk i den menneskelige kolon adenocarcinmoa Caco-2 cellelinje, der har været meget anvendt til at udforske HNF4α aktivitet [5] at identificere en netværk af regulerede gener. Specifikt cellelinien differentierer i enterocytter upon konfluens [6] og udtrykker HNF4α protein sammenlignes med leveren [7]. Her rapporterer vi det første genom-dækkende scanning, der aktiveret en identifikation af 17.500 bindingssteder, som HNF4α og beskrive deres kromosomale distribution. Desuden har vi undersøgt konsekvenserne af HNF4α protein induktion på transkriptionel aktivitet af

de novo Salg identificerede gener og demonstrere god overensstemmelse mellem hidtil ukendt gen mål og deres ekspression i Caco-2-celler. Endelig har vi analyseret HNF4α bindingssteder for berigede bindende motiver og identificeret samarbejder transkriptionsfaktorer, der syntes at handle i koncert med HNF4α i en enhanceosome af transkriptionel regulering.

Resultater

kromatin IP eksperimenter blev udført med Caco-2 cellekulturer og et antistof yderst specifik for HNF4α. Især blev samlede input samt IP-DNA fra tre uafhængige biologiske replikater fremstillet og underkastet en optimeret protokol for unbiased amplifikation ifølge producentens anbefaling (se også Materiale og metode afsnit). Det amplificerede DNA fra uafhængige eksperimenter blev hybridiseret til Affymetrix Humane flisebelægning 2.0R arrays med et genom-dækkende opløsning på 35 bp. Derefter blev rådata undersøgt for beriget regioner ved brug af tre uafhængige algoritmer (TAS [8], MAT [9] og Tilemap [10]). Indledende kriterier cutoff blev sat på den svagt beriget positive kontrol (

OTC

) og yderligere forbedret baseret på hyppigheden af ​​HNF4α -motifs inden for de berigede regioner, som bestemmes af MATCH algoritme [11]. For at få tillid til de data, blev resultaterne fra de tre algoritmer gennemskåret. Overlapningen af ​​berigelse sites (ES) angivet ved de tre metoder var meget høj (fig. 1), selv om små forskelle blev observeret muligvis på grund af de forskellige gentagne bibliotekerne anvendt. Samlet førte denne tilgang til en identifikation af 17.561 ES (tabel S1). Desuden blev en lav sæt stringens data genereret ved at flette ES data detekteret med MAT og Tilemap algoritmer. Dette resulterede i alt 25,419 ES (tabel S2).

Rå data blev analyseret med tre forskellige programmer (Tilemap, MAT og TAS) at identificere HNF4α bindingssteder. Selvom forskellige parameterindstillinger (fx båndbredde på 200, 300 og 400 nukleotider) og forskellige algoritmer blev anvendt, overlapningen var overraskende høj. Den Venn-diagram blev beregnet ved hjælp Intersect funktion af Galaxy [47].

Derudover blev 15 ES af kendte HNF4α gen mål vælges og deres berigelse i den primære IP-DNA blev bestemt ved realtime kvantitativ PCR . For alle udvalgte steder berigelse kunne bekræftes. Således robusthed og kvaliteten af ​​de data er valideret (fig. 2). Blandt de identificerede ES var der HNF4α bindingssteder allerede er beskrevet i litteraturen eller af andetsteds såsom

AAT

(R00114),

GCC Hotel (R08885),

PCK

(R12074 ),

apoB

(R01612),

CYP2C9

(R15905),

AKR1C4

(R13037),

ACADM

(R15923) eller

CYP27A1 Hotel (R15917). I tilfælde af SHBG (R15941), blev ES bestemmes inden for et par hundrede basepar i forhold til de rapporterede bindingssteder. Andre bindingssteder beskrevet i litteraturen, ligesom

ALDH2

(R15845), kunne ikke bekræftes. kvantificering af real time PCR viste imidlertid, at

ALDH2

site blev ikke beriget i den primære IP-DNA. Da HNF4α protein fungerer på en vævsspecifik måde, er det ikke uventet, at nogle ES ikke er bundet i Caco-2-celler; deres tilgængelighed snarere afhænger kromatin organisation, som igen afhænger af celletypen. Dette understøttes af uafhængige undersøgelser, hvor der var blevet observeret signifikante forskelle i DNA-bindingssteder i forskellige celletyper [12].

Berigelse af nye HNF4α bindingssteder detekteret af Chip-chip blev bekræftet ved real time PCR. Chip-DNA fra tre uafhængige forsøg blev anvendt. Normalisering blev udført under anvendelse af en β-actin negativ kontrol, og værdierne er vist som fold berigelse i forhold til samlet input. HNF1α opstrøms er en anden negativ kontrol, som ligger opstrøms for den kendte HNF4α bindingssted i HNF1α promotor og bruges til at bekræfte ß-actin negativ kontrol.

Den HNF4α Motivet er stærkt beriget i chippen regioner

chip-berigede områder blev undersøgt for HNF4α bindende motiver med MATCH algoritme [11]. Brug af strenge kriterier for at minimere falske positiver, . 14-fold berigelse blev observeret for HNF4α målrettede sekvenser sammenlignet med genomisk baggrund (tabel S3)

Regionerne 500 bp omkring de 17.561 identificerede bindingssteder blev analyseret for HNF4α motiver med indstillinger for at minimere falsk negative ved brug af MATCH algoritme [11]. Væsentlige, blev regioner segmenteret i siloer på 25 bp, og antallet af forekomster af de forskellige motiver inden for hver bin blev talt. Dette resulterede i alt 23,145 motiver og svarer til 1,32 motiver /chip region. For 98,1% af chip regioner blev påvist mindst et motiv. Dette antyder, at de fleste af chippen regioner blev beriget skyldes direkte binding af HNF4α. Ved den samme fremgangsmåde de bindingssteder rapporteret for de Encode regioner [3] blev undersøgt og 1,13 motiver /Chip region blev anslået som er mindre end observeret i den foreliggende undersøgelse for eventuelt at foreslå høje opløsning flisebelægning arrays til bedre at identificere ES. Efterfølgende blev fordelingen af ​​HNF4α motiver omkring midten af ​​chippen beriget regioner analyseret (fig. 3a). Størstedelen af ​​motiver er beliggende i et område på kun ~500 basepar. Når de berigede regioner på toppen positioner, der detekteres med MAT-algoritmen blev justeret mod midterstillingen, antallet af HNF4α motiver vokset og derfor indikerer, at toppositionen bedre skøn faktiske bindingssted. Endvidere blev Gibbs-motivet sampler anvendt til at identificere ES regioner for let

de novo

definition af HNF4α motiv (fig. 3b).

a) HNF4α motiver i området på 1.000 bp omgivende berigelse websted (ES) peak eller midterposition som detekteres med MATCH, der bruger cutoffs at minimere falske positiver. Afstanden til centrum af fundne motiver til toppen eller midterstilling af ES blev beregnet. Et histogram blev oprettet ved hjælp siloer på 50 nukleotider omkring centrum eller peak positioner. Den blå linje viser afvigelsen af ​​HNF4α motifs forhold til ES centrum, den røde linje viser afvigelsen i forhold til toppen position. b) HNF4α chip-chip ES at gøre det let

de novo

forudsigelse af HNF4α bindende motiv. Efter analyse af sekvensen af ​​regioner beriget med HNF4α chip-chip med Gibbs motiv sampler, blev HNF4α-motiv faktisk opdaget to gange, med det andet motiv præsentere kun en halv side. c) Bevarelse af alle HNF4α bindingssteder (blå linje). ES centre (blå) eller Peak positioner (rød) blev forlænget til 1000 bp i begge retninger, og for hver nukleotid den gennemsnitlige bevarelse score, baseret på høj kvalitet Phast-Cons oplysninger fra UCSC GoldenPath Genome Resource, blev beregnet. De gennemsnitlige bevarelse scoringer blev afsat mod nukleotider position. Analyser blev udført med det fælles europæiske asylsystem [43].

For at understrege den biologiske betydning af de identificerede bindingssteder deres gennemsnitlige bevaring er undersøgt så godt. Nukleotiderne i centrum, hvor et bindingssted kunne forventes, viser en to gange højere bevarelse end dem ved enderne af plottet (genomisk baggrund) (fig. 3c). Igen, når chippen beriget områder blev tilpasses ved peak position, peak bevaring var endnu bedre defineret.

HNF4α binder overvejende at Enhancer elementer

Afstanden fra HNF4α bindingssted til den nærmeste transskription startsted (TSS) af et RefSeq gen blev bestemt. Her blev der observeret en næsten 5 gange overrepræsentation af bindingssteder i promotorregionen af ​​-1000 til 0 i forhold til TSS (fig. 4a, b). Det er dog kun 5,8% af alle bindingssteder mappet til promotor-proksimale regioner og 3,6% af alle RefSeq initiativtagere er bundet af HNF4α. En lignende og betydelig mangel på præference for binding til 5 ‘promoter-proksimale regioner var blevet indberettet for transkriptionsfaktorer Sp1, P53, cMyc og ERa [13], [8]. Mens nogle transkriptionsfaktorer som E2F1 viser en klar præference for 5 ‘promoter-proksimale regioner [14], akkumulere beviser er meget lovende for promoter-proksimal regioner udgør kun en lille brøkdel af pattedyr gen regulatoriske sekvenser. Faktisk er nogle af de nukleare receptorer vise højere aktivitet ved enhancer i stedet promotor- bindingssteder [13], [15]. Følgelig undersøgelser med promotor- arrays er af begrænset værdi.

a) Placering af HNF4α bindingssteder i forhold til den nærmeste TSS af RefSeq gener sammenlignet med tilfældig fordeling. Regionerne 100.000 nukleotider omgiver hver TSS blev opdelt i siloer på 5.000 nucleotider, og antallet af bindingssteder i hver beholder blev talt. b) Genomisk fordeling af HNF4α bindingssteder. Antallet af bindingssteder placeret i de bestemte dyrkningsområder RefSeq kommenterede gener blev beregnet af software-værktøj CisGenome. TSSup1k: 1,000 bp opstrøms for et transkriptionsstartsitet (TSS); TESdown1k: 1,000 bp nedstrøms for en transskription ende site. c) Fordeling af HNF4α bindingssteder placeret proksimalt til TSS af RefSeq gener i forhold til tilfældig fordeling. Regionerne 5.000 nukleotider omgiver hver TSS blev opdelt i siloer på 200 nucleotider, og antallet af bindingssteder i hver beholder blev talt. d) overrepræsentation af HNF4α bindingssteder i opstrøms og nedstrøms TSS proximale regioner og i første, anden en tredje introns af RefSeq kommenterede gener, i forhold til en tilfældig kontrol regioner. Positionerne af TSS, første, andet og tredje introner af RefSeq kommenterede gener blev hentet fra UCSC, og antallet af HNF4α bindingssteder placeret i de specificerede områder blev beregnet. TSSup600: 600 bp opstrøms for et transkriptionsstartsitet; TSSdown600: 600 bp nedstrøms for en transkriptionsstartsitet; TSSup10k: 10.000 bp opstrøms for en TSS; TSSdown10k:. 10.000 bp nedstrøms en TSS

En analyse af fordelingen af ​​ES 600 bp omkring TSS fremlagt beviser for præferentiel binding i opstrøms region (Fig 4c og d.). Men i en afstand på mere end 800 bp af TSS, er mere bindingssteder placeret nedstrøms. Især er mange transkriptionsfaktorer bindingssteder placeret i den første intron; den anden top er vist i fig. 4c skyldes binding af intron-regioner. blev analyseret yderligere Hyppigheden af ​​HNF4α bindingssteder i RefSeq kommenterede gener. Dette fremgår af en overrepræsentation af ES i de første introns, men i mindre grad i den anden eller tredje (fig. 4d).

Det er vigtigt, en nylig HNF4α chip-chip undersøgelse foreslået, promoter-proksimal ES skyldes indirekte vekselvirkninger af HNF4α med andre transkriptionsfaktorer [3]. Derfor blev en model udviklet hvorved HNF4α binder til fjerne enhancerelementer og skaber kromatin loops ved at interagere med andre promoter-bundne transkriptionsfaktorer. Desværre blev denne model baseret på mindre end 1% af genomiske sekvenser. Baseret på genomet brede scanning rapporteret heri HNF4α bindende motiver i promotor–distale regioner er overrepræsenteret sammenlignet med promotor–proximale regioner (fig. 5a), ikke desto mindre regioner med lav berigelse vise en højere procentdel af promotor–proximale bindingssteder end regioner med høj berigelse (fig. 5b). Muligvis, HNF4α kontakter promotor–proximale regioner ved fysisk interaktion med andre transkriptionsfaktorer og derfor viser promotor samt en enhancer bindingsaktivitet.

a) Bootstrapping analyse af HNF4α bindende motiv (matrix M01031) i promotor-proksimal og promotor distale områder. 100 promoter-proksimal ES (-138 til -2 i forhold til TSS) blev sammenlignet med 100 promoter-distal ES (-24.972–23.489 forhold til TSS) ved bootstrapping analyseværktøj Pobo [48]. Promotor-proksimal ES viser en signifikant lavere antal HNF4α motiver. b) ES (300 bp omgiver topposition) blev sorteret efter deres P-værdi (som beregnet ved MAT algoritme) og opdelt i siloer på 1.000 ES. For hver bin antallet af HNF4α motiv hændelser og procentdelen af ​​promoter-proksimale ES blev beregnet. Som det kan ses, ES med en høj p-værdi (svag ES) er mere tilbøjelige til at være placeret promotor-proksimal men ikke at indeholde HNF4α bindende motiv.

Fordelingen af ​​identificerede ES tværs kromosomerne varieret 6 fold. Påfaldende, Y-kromosomet er blottet for HNF4α ES (tabel S6) og kromosomale fordeling af ES er ikke tilfældigt fordelt; snarere klynger dannes (figur 6a;.. figur 7). Disse klynger er ikke relateret til forskelle i genet tætheden inden for disse områder, som vist for kromosom 10. region med den højeste koncentration af bindingssteder på kromosom 10 indeholder to klynger af bindingssteder med overlappende loci ACSL5 og VTI1A1 (fig. 6b ). Ved at scanne den genomiske sekvens for vinduer i 100.000 bp, som indeholder ≥ 10 HNF4α bindingssteder, kunne femten klynger defineres (tabel S7). Således har de fleste enhancere synes at være promiskuøse og dermed regulere multiple gener [16]. Mens forstærker aktivitet kan finde sted over hundrede kilobaser [17] og endda tilfælde af inter-kromosomal regulering af forstærkere er blevet rapporteret [18], de fleste er inden for 100.000 bp af deres respektive TSS. For bedre at definere en mulig enhanceosome for målgener sekvenser nærmest RefSeq gener med et TSS adskilt af mindre end 100.000 nukleotider blev udvalgt (tabel S8).

a) Fordelingen af ​​HNF4α bindingssteder (lilla linje diagram, øvre halvdelen) sammenholdes med fordelingen af ​​kendte gener på kromosom 10. Grønne pile markerer to gensekvenser-sparse regioner, hvor ES findes. De røde pile markerer to regioner med et højt antal HNF4α bindingssteder og et lavt antal gener. Analyser blev udført ved hjælp af Ensembl værktøj Karyoview (https://www.ensembl.org/Homo_sapiens/karyoview). b) Klynger af HNF4α bindingssteder i en genomisk region på kromosom 10 med højt indhold af bindingssteder (regionen markeret med den anden rød pil i a)). De bindingssteder identificeret i denne undersøgelse, der vises som blå toppe i den øverste halvdel, præsenteres ved hjælp af IGB genom browser. Bindingsstederne er fordelt i to klynger omkring transkriptionsstartstedet af ACSL5 locus og i 3′-regionen af ​​VTI1A locus.

Hver kromosom blev delt i 150 ‘

placeringer

‘, og inden for hvert bin antallet af ES blev talt. I den blå linje diagrammet, er antallet af HNF4α bindingssteder inden for hver bin repræsenteret som en enkelt datapunkt. Under hvert kromosom er givet det minimale og maksimale antal bindingssteder placeret i samme beholder. Analyser blev udført ved hjælp af Ensembl værktøj Karyoview (https://www.ensembl.org/Homo_sapiens/karyoview).

HNF4α transkriptionsfaktor krydstale

For at søge efter transskription faktor krydstale chippen regioner for overrepræsenteret motiver blev overvejet. Blandt de motiver med den højeste berigelse er matricer svarende til HNF4α bindende motiv, for eksempel dem, for COUP-TF, PPAR eller LEF1 (fig. 8, tabel S3, S4, S5). Disse transskriptionsfaktorer er kendt for at konkurrere med HNF4α for fælles bindingssteder [19] – [21]. Men mange motiver ulig HNF4α, f.eks de bindende motiver til HNF1α, AP1 eller GATA transkriptionsfaktorer, blev også signifikant beriget. Hvis disse faktorer virker fælles med HNF4α, kunne man forvente, at frekvensen af ​​deres motiver stiger med aftagende afstand til HNF4α bindingssteder. Derfor hyppigheden af ​​sådanne motiver i forhold til de HNF4α bindingssteder blev analyseret, (fig. 9a og 9b). Den berigelse af disse motiver er begrænset til et område af et par hundrede basepar omkring peak position, derfor støtter tanken om, at de er en del af en enhanceosome defineret af HNF4α. Udover en stigning i hyppigheden af ​​bindende motiver til AP1, GATA, ERa og HNF1α blev observeret et omvendt forhold mellem HNF4α og CART motiver, men der var ingen forbindelse med SREBP1 (fig. 9a). Det er fristende at spekulere, at dette er af lovgivningsmæssig betydning for HNF4α. Andre analyserede motiver viste kun en svag korrelation mellem antallet af motiver og afstanden til toppositionen, selvom de var klart beriget med chip regioner (f.eks USF, CREB, HNF6).

10.000 væsentligste spån- beriget regioner blev analyseret for overrepræsenteret motiver ved brug af det fælles europæiske asylsystem værktøjet [43]. Vist er de 10 motiver med den mest signifikante berigelse, mens redundante motiver (dvs. flere motiver til samme transkriptionsfaktor) blev fjernet. Ligheden eller forskellighed af motiver visualiseres ved hjælp Weblogo afbildning (https://weblogo.berkeley.edu/). Motiv berigelse analyse med Genomatix RegionMiner og MATCH [11] findes i tabel S3, S4, S5.

a) Peak positioner (repræsenteret som 0) blev udvidet til 500 bp i begge retninger, og Motiver blev detekteret ved anvendelse af MATCH algoritme [11] ved brug cutoff kriterier for at minimere summen af ​​falske positive og falske negative. Områder blev segmenteret i siloer på 25 bp, og antallet af forekomster af de forskellige motiver inden for hver bin blev talt. b) Plot af den relative afstand af HNF4α motiver til andre motiver beriget i chippen regionen. Inden CHIP regioner de mest konserverede HNF4α motiver, hvor identificerede. Sekvenserne af de 500 nukleotider omkring disse mest bevarede HNF4α motiver, hvor hentede og analyseret for de motiver af andre TF, der også beriget med chippen regioner. Derefter blev afstanden mellem disse motiver og HNF4α motiv beregnet ved anvendelse CisGenome for motiv detektion og plottet som histogram under anvendelse placeringer på 20 bp. Den HNF4α motiv findes i centrum og nåede fra bp -6 til bp 6. HNF4α og ERa deler fælles og overlappende bindingssteder. c) Visning af overlapning mellem de bindende motiver af HNF4α og østrogen receptor (ERa) ved brug af Weblogo illustrationer. Begge motiver viser en partiel overlapning. d) Overlapning mellem ERa- bindingssteder og HNF4α bindingssteder. Den høj stringens sæt ERa- bindingssteder identificeret af Chip-chip [13] blev opnået. Den procentdel af ERa- bindingssteder identificeret i denne undersøgelse, og også bundet af HNF4α vises i et søjlediagram. Overlappet af ERa- bindingssteder med tilfældige kontrol regioner blev bestemt.

Den høje sekvens lighed af bindingssteder for HNF4α og østrogen receptor (ERa) er af væsentlig betydning (fig. 9c). For yderligere at analysere sandsynligheden for co-belægning af berigede motiver de HNF4α bindingssteder blev bestemt nøjagtigt ved motiv-analyse. Det genomiske position af højest scorende HNF4α motiv i chippen regioner blev hentet og udvidet til 500 nukleotider til venstre og højre flankerende sekvenser. Inden for disse sekvenser, blev andre berigede motiver detekteret og afstanden til HNF4α motivet blev beregnet (fig. 9b). Som forventet, de fleste ERa motiver co-finde på HNF4α ES forårsager en høj top i midten. I modsætning hertil HNF1α, AP1 og GATA motiver viser berigelse i en afstand på 20 til 60 nukleotider til HNF4α motiv. Der er også en berigelse af mindre konserverede HNF4α bindingssteder i umiddelbar nærhed af højest scorende HNF4α motiv. Denne overrepræsentation af mindre bevarede HNF4α motiver kan spille en rolle i at øge sandsynligheden for HNF4α binding på den lokale sekvens kontekst omkring bindingssted.

Som ERa motivet overlapper delvist med HNF4α motiv, er det fristende at spekulere at en sådan berigelse i chippen regioner skyldes en funktionel forbindelse mellem de to faktorer. For nylig blev et genom-dækkende kort over ERa- bindingssteder rapporteret [13]. Derfor dataene for ERa- og HNF4α sites blev analyseret og fundet betydeligt overlap (fig. 9d). Brug enten lav eller høj stringens sæt HNF4α eller ERa bindende sites op til omkring 15% af de ERa- bindingssteder blev også ramt af HNF4α, dermed støtte ideen om et samarbejde mellem HNF4α og ERa nukleare receptor. Vigtigere, flere uafhængige undersøgelser rapporterer synergisme i transskriptionsfaktoren aktivitet af HNF4α og ERa i genregulering af for eksempel, apolipoprotein A1, apoVLDII og den lille heterodimer partner.

Genom-dækkende scanning afslører HNF4α s masterfunktionen

data fra denne undersøgelse blev sammenlignet med offentliggjorte data for at identificere områder, der overlapper blandt disse undersøgelser (fig. 10). Af de 194 ES rapporteret inden for de Encode regioner [3], 76 overlappede med resultaterne af den foreliggende undersøgelse. Desværre Encode regioner udgør 1% af kun hele genomet. Endvidere i en promotor-fokuseret undersøgelse [4] blev rapporteret 1.553 bundne sekvenser for hepatocytter. I den foreliggende undersøgelse og ved at vælge tilsvarende regioner sekvens i alt 575 bindingssteder kunne undersøges. Af disse 200 bindingssteder blev almindeligt, derfor fornyet bekræftelse 13% af de foreslåede promotor- binding sites. Endvidere samme investigator rapporteret ES for pancreas-øer, men kun 9% kunne bekræftes i nærværende undersøgelse med IP DNA fra Caco-2-cellelinien. Sådanne forskelle kan opstå fra de forskellige eksperimentelle protokoller og forskelle i celletyper.

Procentdel af HNF4α bindingssteder identificeret af Rada-Iglesias et al. [3] eller Odom et al. [4], som kunne bekræftes i denne undersøgelse. For Rada-Iglesias et al. en kontrolgruppe af tilfældige genomiske sekvenser blev anvendt til at beregne den tilfældige overlap. For Odom et al., Blev en kontrolgruppe oprettes ved at vælge tilfældigt et antal promotorregioner fra Huk13 arrayet anvendt i deres undersøgelse, svarende til antallet af promotorer, de viser sig at være bundet af HNF4α.

Biologiske ontologier af

de novo

identificeret HNF4α gen mål

Baseret på Gene ontologi

de novo

identificerede gener blev grupperet (tabel S9). Mange af de målrettede gener er involveret i forskellige metaboliske processer, f.eks lipid, organisk syre eller kulhydratstofskiftet. Kategorier i forbindelse med transport, dvs. lipid transport, sås signifikant overrepræsenteret som var fedtsyre og cholesterol-metabolisme [1], [22]. Derudover blev mange gener for udvikling og differentiering identificeres derfor betryggende HNF4α rolle i udvikling [23] og epitheldifferentiering [22], [24] – [26]. Dette protein styrer også insulin Udskillelsen [27] og er knyttet til sjældne monogeniske lidelse, dvs. modenhed-debut diabetes af den unge (MODY) [28]. Således gener ramt af HNF4α i insulin-signalvejen samt sådanne relateret til celledød og tumor suppressor aktivitet blev identificeret [29]

Definition funktionelle bindingssteder -. Sammenhæng mellem genom-dækkende HNF4α chip-chip og genekspression data

en fælles tilgang til at identificere gener er omfattet af en transskription faktor er at bestemme mRNA overflod forårsaget af dets øgede eller formindsket transkriptionel aktivitet som undersøgt i humane embryonale nyre (HEK293 [30]) og hepatomaceller (Huh7 [31], HepG2 [32]). Overraskende HNF4α transfektionsforsøg påvirket transkription af et lille antal kun gener. Mens det er kendt, at transkriptionel regulering ikke medieres på niveauet for DNA-binding alene [33] i sådanne forsøg fleste transkriptionsfaktorer binder under “ikke-aktiverende” betingelser. For at bekræfte funktionelle bindingssteder af

de novo

identificerede HNF4α gen mål blev Caco-2 cellekulturer behandlet med en inducer af HNF4α protein [34]. Efter behandling af Caco-2 celler med Aroclor 1254, binding af HNF4α proteinet til

HNF1α

promotoren blev forøget [7], mens induktionen af ​​proteinet blev bekræftet ved Western blotting eksperimenter (fig. 11). De Aroclor 1254 behandlede kulturer blev underkastet hele genomet transkript profilering. Ved hjælp af strenge kriterier, blev 536 unikke RefSeq-kommenteret gener defineret som differentielt udtrykt (tabel S10). Af disse blev 383 gener opreguleret og 153 nedreguleret. Promotorsekvenserne af regulerede gener blev analyseret for HNF4α bindingssteder og sammenlignes med listen af ​​nyligt identificerede chip-chip genmål. Et overlap på 63% eller 336 differentielt udtrykte gener (Tabel S11) blev identificeret som HNF4α gen mål, hvilket bekræfter den funktionelle betydning af de ES identificeret i chippen-chip-analysen.

a) HNF4α Western blotting af 20 ug Caco-2 celleekstrakt. En klar induktion af HNF4α proteinekspression blev set efter 48 timer og 72 timer i Aroclor1254 behandling. b) Elektroforetisk mobilitet ændring-assays med 2,5 ug Caco-2 celler kerneekstrakt og oligonucleotider svarende til A-site af HNF1α promotoren (HNF1pro) som 32P mærket probe. I supershift assays et antistof rettet mod HNF4α (+) blev tilsat. Binding af HNF4α var signifikant forøget efter 72 timer af Aroclor1254 induktion.

Endelig offentliggjorte data om HNF4α overekspression pattedyrcellelinjer blev sammenlignet med data fra dette studie. Overlapningen varierede fra 65 til 94% af generne identificeret (tabel S10). Vigtigt er det, blev den højeste overlapning opnået i undersøgelser, der anvendte knock-down siRNA eksperimenter for at validere deres resultater [32]. Derfor kan gen-mål rapporteret her betragtes som mere pålidelige.

Diskussion

Tidligere forskning i trans-virkende faktorer og deres tilsvarende

cis

-elementer fokuseret på promotor -nære bindingssteder. Med udviklingen af ​​chip-chip assays, genom-dækkende scanner for transkriptionsfaktorbindingssites blev realisabelt. Dette væsentligt forbedret forståelse af grundlæggende mekanismer i transkriptionel kontrol og en identifikation af promotorelementer distale bindingssteder letter RNA processeringsbegivenheder.

I den foreliggende undersøgelse, et genom-dækkende kort over HNF4α bindingssteder blev konstrueret. Dette protein spiller en vigtig rolle i leverudvikling, og dets fører regulerende rolle i opretholdelsen af ​​det metaboliske kompetence leveren har stimuleret forskning i HNF4α målrettet cancerterapier for sin evne til at vende tilbage leverkræft til en mindre aggressiv fænotype [35].

den foreliggende undersøgelse beviser 90% af HNF4α bindingssteder at være placeret i promoter-distal regioner og denne fordeling af ES er den samme som rapporteret for ERa [13]. Især med undtagelse af regioner nærmere end 600 basepar til TSS, bindingssteder var oftere nedstrøms. Derfor chip-chip analyser med fokus på promotorområder kun [4], [36] kunne gå glip af størstedelen af ​​bindingssteder.

Desuden en analyse af HNF4α motiver inden chip-beriget regioner viser så høj nøjagtighed som i

Be the first to comment

Leave a Reply