PLoS ONE: Identifikation af fælles differentielt udtrykte gener i Urinary blærekræft

Abstrakt

Baggrund

Aktuel diagnose og behandling af urin blærekræft (BC) har vist store fremskridt med udnyttelsen af ​​mikroarrays.

Formål

Vores mål var at identificere fælles differentielt udtrykte (DE) gener blandt klinisk relevante underklasser af BC hjælp mikroarrays.

Metodologi /vigtigste resultater

BC prøver og kontroller, både eksperimentelle og offentligt tilgængelige datasæt, blev analyseret ved hele genomet microarrays. Vi grupperet prøverne efter deres histologi og defineret The De gener i hver prøve individuelt, såvel som i hver tumor gruppe. En dobbelt analyse strategi blev fulgt. Først blev eksperimentelle prøver analyseret og konklusioner blev formuleret; og for det andet, blev eksperimentelle sæt kombineret med offentligt tilgængelige microarray datasæt og blev yderligere analyseret i jagten på fælles DE gener. Den eksperimentelle datasæt identificeret 831 gener, der var DE i alle tumorprøver, samtidigt. Desuden 33 gener var opreguleret og 85 gener blev nedreguleret i alle 10 BC prøver sammenlignet med de 5 normale væv, samtidigt. Hierarkisk klyngedannelse partitioneret tumor grupper i overensstemmelse med deres histologi. K-betyder gruppering af alle gener og alle prøver, samt clustering af tumor grupper præsenterede 49 klynger. K-midler clustering af fælles DE gener i alle prøver afslørede 24 klynger. Gener manifesteret forskellige differentielle mønstre af udtryk, baseret på PCA. YY1 og NFKB var blandt de mest almindelige transkriptionsfaktorer, der regulerede ekspression af de identificerede DE generne. Kromosom 1 indeholdt 32 DE gener, efterfulgt af kromosomer 2 og 11, som indeholdt 25 og 23 de gener, henholdsvis. Kromosom 21 havde det mindste antal DE gener. GO-analyse afslørede forekomsten af ​​transport og bindende gener i de fælles nedreguleres DE-gener; forekomsten af ​​RNA metabolisme og forarbejder gener i op-regulerede DE gener; samt forekomsten af ​​gener, der er ansvarlige for celle kommunikation og signaltransduktion i DE gener, der blev nedreguleret i T1-Grade III tumorer og up-reguleret i T2 /T3-Grade III tumorer. Kombination af prøver fra alle microarray platforme afsløret 17 almindelige DE gener, (BMP4, CRYGD, DBH, GJB1, KRT83, MPZ, NHLH1, TACR3, ACTC1, MFAP4, SPARCL1, TAGLN, TPM2, CDC20, LHCGR, TM9SF1 og HCCS) 4 af som deltager i en lang række veje.

konklusioner /betydning

identifikationen af ​​de fælles dE generne blandt BC prøver af forskellig histologi kan give yderligere indsigt i opdagelsen af ​​nye formodede markører.

Henvisning: Zaravinos A, Lambrou GI, Boulalas i, Delakas D, Spandidos DA (2011) Identifikation af fælles differentielt udtrykte gener i Urinary blærekræft. PLoS ONE 6 (4): e18135. doi: 10,1371 /journal.pone.0018135

Redaktør: Michael Polymenis, Texas A M University, USA

Modtaget: 9. september 2010; Accepteret: 26 februar 2011; Udgivet: April 4, 2011

Copyright: © 2011 Zaravinos et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Afdeling af urologi, Asklipieio General Hospital, 16673 Voula, Athen, Grækenland finansieret nærværende undersøgelse. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

kræft i urinblæren (BC) er den femte mest almindelige kræftform hos mænd. Toppen forekomsten af ​​sygdommen er blandt patienter 60-70 år. BC er helbredes, hvis diagnosticeret i de tidlige stadier af sygdommen. Tumorer i urinblæren udvikle via to adskilte men noget overlappende veje: den papillære og ikke-papillær. Ca. 80% af BCs består af overfladiske eksofytiske papillære læsioner, der stammer fra urotelial hyperplasi. Disse typisk lav kvalitet papillære tumorer kan gentage sig, men sjældent invadere blærevæggen eller metastaserer. De resterende 15-20% af tumorer repræsenterer høj kvalitet solide ikke-papillære BCs, der opstår fra høj kvalitet intraurothelial neoplasi. Disse tumorer aggressivt invadere blærevæggen og har en høj tilbøjelighed til fjernmetastaser [1].

Parallel gen-udtryk overvågning er et kraftfuldt værktøj til at analysere relationer mellem blæretumorer, opdage nye tumor undergrupper, tildele tumorer til at pre -defined klasser, identificere co-regulerede eller tumor stadie-specifikke gener og forudsige udfaldet sygdom [2], [3], [4], [5], [6], [7], [8]. Til dato er der brugt mange kræfter for at identificere gener, der viser forskellen udtryk (DE) mellem forskellige tumortyper vs. andre væv grupper, såsom fænotypisk normale væv. Men de rapporterede DE generne varierer mellem forskellige studiegrupper, afhængigt af microarray-baserede metode og antallet af sager. Et spændende spørgsmål, der endnu ikke er blevet overvejet indebærer mulig data, der kan indsamles om gener, der udtrykkes differentielt samtidigt i alle studie tumor tilfælde.

I den foreliggende undersøgelse, vi udførte cDNA microarray analyse, omfattende in- hus eksperimentelle samt offentligt tilgængelige data, at analysere genekspression profil BC og fastsætte dE generne mellem kræft og sundt væv. Påvisningen af ​​DE-gener blev udført i hver prøve individuelt, såvel som i hver tumor gruppe, som defineret ved histologisk undersøgelse og rapporterede data. Data blev grupperet med forskellige algoritmer, og funktioner af de kendte DE generne blev yderligere defineret af Gene ontologi. Desuden søgte vi ikke kun for forskelle mellem tumortyper, men snarere for ligheder. Årsagen hertil var, at selv om der forventes forskellige tumortyper at have forskelle i deres udtryk profiler selv mellem individer med den samme tumor subtype, vi den hypotese, at tumorer besidder samme karakteristika som med tiden kan føre til viden om de ætiologier af carcinogenese. I en betydelig værk af

Goldstein et al.

Et forsøg på at opdage en fælles celle af oprindelse for prostatakræft blev rapporteret. De antydede, at på trods af forskellene at tumorceller deler, er der en mulighed for en fælles oprindelse [9]. I samme retning forsøgte vi at identificere fælles genekspressionsprofiler blandt forskellige tumorvæv. På dette tidspunkt bør vi nævne, at genekspression, især fra tumorbiopsier, betegner bogstaveligt talt en “snap-shot” af state-space af det ellers dynamiske opførsel af sygdommen. Alligevel kunne denne “snap-shot” være tilstrækkelig for at få nyttige oplysninger om dynamikken i systemet med undersøgelsen. Især i tilfælde af tumorer, det er det eneste værktøj, vi har for at udtrække oplysninger på

ex vivo

niveau.

De nuværende data understøtter værdien af ​​microarray-baserede genekspression signaturer da disse identificere klinisk vigtige cellulære egenskaber.

Materialer og metoder

tumorvæv Sampling og Kirurgisk procedure

Ti urin blærekræft prøver fra patienter med nyligt diagnosticeret BCs gennemgår transuretral blære tumor resektion ved Institut for Urology, “Asklipieio” General Hospital, Athen, samt fem normale vævsprøver, blev erhvervet efter den mængde væv er nødvendig for rutinemæssig patologi undersøgelse var blevet fjernet. De undersøgte patienter var af fremskreden alder (73,9 ± 12,0 år). Størstedelen (6/10, 60%) var rygere eller tidligere rygere, mens fire (40%) var præget af en vis grad af erhvervsmæssig eksponering for agenter i forbindelse med BC (maling, kemikalier, etc.). Alle tumor prøver blev klassificeret og sorteres efter samme patolog. Histologisk sortering blev udført ved hjælp af både 1973 World Health Organization (WHO) og 2004 WHO /International Society of Urologic Patologi (ISUP) klassificeringer [1]. Tumor etape blev vurderet i henhold til den 2002 amerikanske blandede udvalg om kræft iscenesættelse systemet [10]. Skriftligt informeret samtykke blev opnået fra alle patienter inkluderet i denne undersøgelse. Undersøgelsen protokol Den blev godkendt af den etiske komité i Kreta Universitet. Kriterier anvendte elektivt dissekeret primære BCs og tilgængeligheden af ​​DNA fra normalt og tumorvæv for biomolekylær analyser. Eksklusionskriterier var en historie af tidligere neoplasmer og kemoterapi eller strålebehandling før operationen

Vævsprøver blev opnået ved kirurgi fra tumoren, og følgende tre groft normale udvalgte steder (kold kop biopsier):. Bageste væg, trigone og område støder op til tumoren. Dele af dissekerede normale prøver blev sendt til histopatologisk analyse. Tumor og normalt væv blev frosset øjeblikkeligt i flydende nitrogen, transporteres og opbevares ved -80 ° C indtil DNA-ekstraktion.

Patienter med ikke-muskel-invasiv BCs blev fulgt op med periodiske cystoskopisk undersøgelser og intravesikal behandling som angivet. Patienter med invasive BCs blev tilbudt radikal cystektomi med eller uden systemisk kemoterapi.

Immunhistokemi

Sektioner, 3 mm tykke, af formalin-fikseret, paraffinindstøbt væv blev skåret og placeret på objektglas belagt med 3-aminopropyltriethoxysilone. Objektglas blev tørret ved 56 ° C i 1 time, før immunhistokemisk farvning. Vævssnit blev afparaffiniseret i xylen før rehydrering i graduerede alkoholer, og endogen peroxidaseaktivitet blev blokeret ved behandling med 3% H

2O

2 ved stuetemperatur i 15 min. Antigen demaskering blev udført ved 30 minutters inkubation ved 80 ° C i 10 mM trinatriumcitrat (pH 6,1). Immunfarvning og åbenbaring blev udført på en Dako automatisere. Objektglas blev inkuberet ved stuetemperatur med primære polyklonale gede-antistoffer mod anti-ErbB2 (1:800, Dako), cyclin D1 (1:100; SP4, Epitomics), monoklonalt antistof mod anti-p53 (1:250; E26; Epitomics) og monoklonalt antistof mod anti-Ki-67 (1:100, SP6, Epitomics). Epitoper af det primære antistof blev lokaliseret ved immunoperoxidaseteknik hjælp det sekundære antistof avidin-biotin kompleks og peroxidasesubstrat kit (kit 5001, Dako) i overensstemmelse med producentens protokol. Snittene blev derefter behandlet med Chromagen 30-30 diaminobenziden tetrahydrochlorid at identificere sites for immunfældning ved lysmikroskopi. Endelig blev sektionerne vasket, kontrastfarvet med hæmatoxylin, og monteret under dækglas. Ingen specifik farvning blev observeret, når det primære antistof blev udeladt fra protokollen (negativ kontrol). Specificitet af immunfarvning blev yderligere kontrolleret ved samtidig farvning af prøver brystkræft med kendt ErbB2, cyclin D1, p53 og Ki67 ekspressionsmønstre. En erfaren patolog scorede farvningen intensitet på fire niveauer (negative, svage, moderate og stærke), overvejer både farve intensitet og antal farvede celler.

Microarray Eksperimenteren og inklusion af offentligt tilgængelige Microarray Datasæt

Oligoer microarray chips (~57 k gener) blev opnået fra GE HealthCare (IL) og AppliedMicroarrays (MA) (tidligere Amersham Biosciences) (CodeLink 57 k Menneskelig Whole Genome) [11], [12], [13]. Hybridisering blev udført med CodeLink RNA-amplifikation og mærkning kit som beskrevet af producenten, benytter det Cy5 fluorescerende farvestof. Objektglas blev scannet med en microarray scanner (ScanArray 4000XL). Billeder blev genereret med erhvervelse ScanArray microarray software (GSI Lumonics, USA). cRNA’er fra tre forsøgsopstillinger blev anvendt i enkelte eksperimenter med indvendige pigge som kontroller. De eksperimentelle opstillinger bestod af 10 urin BC prøver af forskellig histologi (se Tissue Sampling og Kirurgisk Procedure afsnit) og 5 kontrolprøver. De scannede billeder blev yderligere behandlet med CodeLink Expression Analysis Software v5.0 fra Amersham Biosciences (i øjeblikket GE Health Care Inc.). Den eksperimentelle opstilling blev analyseret på grundlag af henvisningen-design, som tidligere beskrevet [14], [15], [16] som beskrevet i figur S1A. Alle tumorprøver blev sammenlignet mod middelværdien af ​​kontrolprøver. Rå microarray data er tilgængelige på GEO microarray database. Alle microarray data er MIAME kompatible

For at udvide antallet af BC prøver, der undersøges, vi omfattede følgende offentligt tilgængelige microarray datasæt i vores analyse:. 1) GSE89 datasæt (GDS183) [17], der består af 40 BC prøver; 2) GSE3167 datasæt (GDS1479) [18], der består af 60 prøver (9 kontroller og 51 BC prøver); 3) GSE7476 datasæt [19], der består af 12 prøver (3 kontroller og 9 BC prøver) og 4) GSE12630 datasæt [20], der består af 19 BC prøver. I alt blev vores samlet microarray analyse består af 17 kontrolprøver (n = 5, for CodeLink platform, og n = 12, for de resterende microarray platforme) og 129 f.Kr. prøver (n = 10, for CodeLink platform; og n = 119, for de resterende microarray platforme). Offentlige data blev brugt i deres disponible normaliseret form da baggrunden korrektion og normalisering allerede var blevet udført.

Microarray Databehandling

Microarray Datafiltrering og Baggrund Korrektion af CodeLink Platform.

Filtrering udføres baseret på det signal intensitet og på kriteriet om, hvorvidt dette signal er over et vist niveau. I vores analyse blev filtreringen udført under anvendelse af ligningen: hvor S er den målte signal intensitet, B

L er den lokale baggrund målt og σ

BL er standardafvigelsen af ​​den lokale baggrund. Signaler med intensitet lavere end ovennævnte målte, opnåede et flag. Baggrund korrektion blev udført ved at subtrahere medianen globale baggrund fra medianen lokal baggrund fra signalintensiteten. En tærskel på 2 blev sat som cut-off, hvilket betyder, at stedet intensitet i mindst én kanal skal være dobbelt så meget som for baggrunden.

microarraydata normalisering af CodeLink Platform.

Microarray data blev normaliseret ved standard procedure for CodeLink software, blev dvs spot intensiteter divideret med den globale median (global median normalisering) [13]. Normaliserede data blev udvundet, forbehandlet og sorteret med Microsoft Excel ®. For yderligere dataanalyse blev brugt Matlab ® (The MathWorks Inc.) computing miljø. Data blev undersøgt for deres fordeling mønster for yderligere valg af den statistiske testmetode.

Microarray data Cross-Normalisering.

mikroarraydata var cross-normaliseret, ved hjælp af en fraktil algoritme, for at kontoen for bias, der var inkluderet på grund af eksperimenter, forskellige platforme og forskellige prøvetagning (figur S2). Normalisering af cross-platform-data er tidligere beskrevet [21], [22], [23] med meget gode korrelationer og konsistens mellem CodeLink og Affymetrix platforme [24], [25].

Oprettelse af en fælles Gene List og BC grupper

for at sikre, at resultaterne af vores analyse var sammenlignelige, vi skabt en fælles gen liste blandt alle microarray platforme. Til dette formål blev NCBI Gene ID-nummer benyttes som en fælles reference. Efter at have sammenlignet DE generne blandt alle datasæt, blev kun de tilstedeværende i alle platforme udvalgt til yderligere analyse. I alt denne filtrering tilgang gav et gen sæt 11,837 entydige poster, samtidigt til stede i alle microarray platforme. Datasæt blev anvendt som individuelle prøver såvel som i tumor grupper. Fordelingen gruppen fremgår af tabel S1.

Microarray data Statistik for CodeLink Platform og de offentligt tilgængelige Microarray Datasæt

Med hensyn til CodeLink platform, vores tilgang bestod af følgende metode. Hvert gen blev testet for dets betydning i differentiel ekspression under anvendelse af en z-test. Gener blev anset for at være væsentligt forskelligt udtryk, hvis de opnåede en p-værdi 0,05. Sammenligninger blev foretaget både blandt eksperimenter samt inden eksperimenter. Indstil manipulation blev derefter anvendt for at opdage yderligere delmængder, der ville kendetegner om muligt alle tumorprøver. . For yderligere analyser vi brugte de gener, der blev udtrykkes forskelligt blandt tumorprøver

Med hensyn til sammenligningen mellem gener af alle de tilgængelige microarray datasæt, brugte vi følgende metode:

Først søgte vi for forskelle, der sammenligner alle kontrolprøver (betragtes som én gruppe), mod alle tumor prøver (betragtes som en anden gruppe), ved hjælp af en to-halet to stikprøver T-test. Da disse grupper indeholdt prøver, som varierede i etnicitet og tumorklassificering, vi kontrollerede al skævhed ved at sammenligne dem som unified grupper.

andet, vi adskilte prøver i grupper (11 grupper i alt) (tabel S1), og hver gruppe blev sammenlignet mod alle kontrolprøver, ved hjælp af en to-halet to stikprøver T-test.

for det tredje, vi sammenlignet prøver individuelt for væsentlige gener blandt hvert forsøg, ved hjælp af en to-halet z-test, som er benævnt “intra-eksperimenterende”. Denne type sammenligning havde en særegenhed. Eftersom ekspression af generne blev sammenlignet med gennemsnittet af genekspressionen inden for samme eksperiment, ville DE gener betyde den forskel, at hver vævsprøve udstillet i sammenligning med de normale væv. Det betyder, at de fælles gener blandt dem ville være de gener, der er fælles for tumorvævet.

Vi sammenlignede prøver individuelt for væsentlige gener dvs gen nøgletal, blandt forsøgsopstillinger, anvendelse af en to-halet z-test, som vi kalder “inter-eksperimenterende”. Med andre ord, vi søgte efter gener, som udviste forskellig ekspression fra én prøve til den næste, men ikke mod kontrolprøverne. Interessant, de betydelige gener afledt af disse omfattede gener, der ikke var DE. Med andre ord blev disse gener identificeret blandt dem, hvis udtryk forblev den samme på tværs af alle prøver.

For at identificere de differentielt udtrykte gener, vi brugte to metoder. Gener blev anset for at være væsentligt forskelligt udtryk, hvis de opnåede en p-værdi 0,05. Sammenligninger blev foretaget både blandt eksperimenter samt inden eksperimenter. Indstil manipulation blev derefter anvendt for at opdage yderligere delmængder, der ville kendetegner om muligt alle tumorprøver. For yderligere analyser brugte vi de gener, der blev udtrykkes forskelligt blandt tumor prøver, på en need-to-use basis. I det tilfælde, hvor prøven blev sammenlignet, blev middelværdien af ​​hvert gen taget imod gennemsnittet af alle kontrolprøver. I tilfælde af individuelle sammenligninger af prøver blev gen-nøgletal beregnes i forhold til gennemsnittet af alle kontrolprøver.

Falsk Discovery Rate (FDR)

False Discovery Rate blev beregnet som tidligere beskrevet [26 ], [27], [28].

Clustering analyse

Clustering analyse blev udført med k-betyder algoritme. I alt 81 klynger af det komplette datasæt for CodeLink platformen og 100 klynger for alle tilgængelige datasæt, blev dannet og DE generne blev yderligere klassificeret ved hjælp af to-vejs (gener-mod-prøver) gennemsnit-kobling hierarkisk klyngedannelse med euklidisk afstand [29 ]. Clustering analyse og kromosomkortlægning var delvist udført med Genesis 1.7.2 (Technische Universitaet-Graz, Østrig) ved hjælp af Pearsons korrelation (

r

) og Spearman rang orden korrelation (

ρ

) [30 ], [31], [32].

TFBM Analyse

for at identificere de transkriptionsfaktorer driver de observerede ændringer i genekspression, vi undersøgte transskriptionsfaktorbindende Motiver (TFBMs) i Transskription Element Listening System Database (Telis) (www.telis.ucla.edu) [33]. Den TRANSFAC transkriptionsfaktor database blev anvendt til identifikation af genet transcriptionsfaktor bindingssites [34].

kromosomkortlægning

Kromosomkortlægning synes at være en lovende fremgangsmåde til at identificere mønstre blandt gener. Hovedidéen oprindeligt rapporteret af

Cohen et al

. er at mappe gener på kromosomale regioner og på denne måde, hvis korrelationer findes de vises gennem placeringen af ​​gener på kromosomale regioner, idet konsekutive gener ofte er ligeledes udtrykt [30]. For kromosomkortlægning analyse, brugte vi Gene ontologi Tree Machine, WebGestalt web-værktøj (Vanderbilt University, Holland, https://bioinfo.vanderbilt.edu/gotm/) [35] og Matlab ® (The MathWorks Inc.) computing miljø.

Gene Ontology (GO) analyse

Gene Ontology (GO) analyse blev indledningsvis udføres ved hjælp af Egon online værktøj til Gene ontologi (The Norges teknisk-naturvidenskabelige universitet, Trondheim, Norge , https://www.genetools.microarray.ntnu.no/egon/) for at finde manglende gen symboler [36]. WebGestalt web-værktøj (Vanderbilt University, Holland, https://bioinfo.vanderbilt.edu/gotm/) [35], [37] blev brugt til gen-funktion klassifikationer. Forbindelser differentielt udtrykte gener og transskription faktor bindende motiver blev yderligere undersøgt ved hjælp af Pubgene ontologi Database (www.pubgene.org). Gene definitioner og funktioner blev baseret på National Institute of Health databaser (https://www.ncbi.nlm.nih.gov/sites/entrez/).

GEO tiltrædelse numre

Array data blev deponeret i Gene Expression Omnibus (National center for Biotechnology Information) med tal tiltrædelse GSM678186 gennem GSM678385 (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE27448).

Results

Immunohistochemistry

Tumor prøver blev farvet med antistoffer for ErbB2, cyclin D1, p53 og Ki-67. Hvis tilstede, anti-ErbB2-farvning i tumorprøver er en membran farvning, diffus i urothelium (figur 1). Alle TCC prøver (100%) viste moderat /strong (++, +++) immunfarvning, mens ingen TCC prøve viste ingen /svag immunfarvning (0, +). Tærskelværdier for høje indekser mærkning blev fastsat for Ki-67 ved ≥10% positive tumor kerner og for p53 på 10 og 20%. T1 /2-grad III tumorer udviste den stærkeste immunofarvning (+++, 70%). T1-Grade I /II tumorer udviste svag farvning for anti-Ki-67 (40% og 7,5%, henholdsvis), hvorimod T1 /2-Grade III tumorer udviste den stærkeste immunfarvning (54%). Tilsvarende udviste T1-Grade I /II tumorer svag farvning for anti-p53 (10% og 35%, henholdsvis), hvorimod T1 /2-grad III tumorer udviste den stærkeste immunfarvning (53%). På den anden side viste T1-Grade I /II tumorer intens farvning for anti-cyclin D1 (80% og 80%, henholdsvis), hvorimod T1 /2-grad III tumorer udviste svag immunfarvning (31,8%).

på den anden side viste T1-Grade II tumorer intens farvning for anti-cyclin D1 (80%), mens T1-Grade III tumorer udviste svag immunfarvning. Repræsentant H E dias betegne histologi T1-Grade II, T1-Grade III og T2-Grade III tumorer

CodeLink Platform data Distribution og analyse

Microarray data blev undersøgt. for deres normalfordeling ejendom. De normaliserede data fulgte en normal fordeling som beskrevet i figur S1B og S1c. Z-test statistik blev anvendt på data, både på individuelle prøver samt på tumor grupper. I tilfælde af tumor grupper, gener, der opnåede en p-værdi 0,05 blev anset differentielt udtrykte. I fig S3A-C fordelingen af ​​p-værdierne er præsenteret. FDR blev beregnet som tidligere rapporteret [27], [28]. FDR blev beregnet til 9,3% for en p-værdi 0,05 for tumorer i T1-Grade II gruppe, 8,6% for p-værdi 0,05 for tumorer i T1-Grade III-gruppen og 11,03% for p-værdi 0,05 for tumorer i T2 og T3-Grade III gruppe (figur S3D-F). Den samme procedure blev fulgt for hver prøve enkeltvis. Gener blev plottet i box-plots for at undersøge udtrykket udlodninger i yderligere detaljer. Box-plot af tumor grupper såvel som for de enkelte prøver er afbildet i figur S4A og Figur s4b henholdsvis

Analyse af fælles differentielt udtrykte gener:. CodeLink Platform

For at identificere genet udtryk mønstre i urin BC, vi analyseret yderligere vores microarray data på en sådan måde, at de fælles mønstre af udtryk mellem de forskellige prøver blev identificeret. Vi fokuserede vores analyse, ikke kun på forskellene mellem tumor prøver, men også på deres ligheder. Det var ikke overraskende, at sådanne ligheder fandtes. Skæringspunkter individuelle tumorprøver viste 831 gener, der blev samtidig udtrykkes forskelligt i alle de tumorprøver (enten op- eller nedreguleres). Af disse DE gener, identificerede vi 33 gener med samtidig øget ekspression og 85 gener med samtidig nedsat til udtryk i alle BC prøver sammenlignet med normalt væv.

Blandt de op-regulerede gener, der indebærer den største fold udtryk ( middelværdi ± SD) var: hypoxi-inducerbare protein 2 (HIG2; NM_013332.1) (2,70 ± 0,54); APC11 anafase-promoverende kompleks underenhed 11 (ANAPC11; NM_001002245.1) (2,50 ± 0,60); zo54e12s1 Stratagene bugspytkirtlen (# 937.208) cDNA klon IMAGE: 590.734 3 ‘ligner TR: G1022718 G1022718 nuklearreceptor CO-repressor (NCOR1; AA156336.1) (2,01 ± 1,13); UI-1-BB1p-atp-e-01-0-UIs1 NCI_CGAP_Pl6 cDNA klon UI-1-BB1p-ATP-e-01-0-UI 3 ‘, (BU754189; BU754189.1) (1,89 ± 0,56). Tilsvarende de gener, der udstillede de laveste fold udtryk satser (gennemsnit ± SD) var: tn52a12.x1 NCI_CGAP_Kid11 cDNA klon IMAGE: 2.171.998 3 ‘ligner indeholder PTR5.b2 MER22 gentagne element (AI565993; AI565993.1) (-3,13 ± 0,66 ); zx51b02r1 Soares_testis_NHT cDNA klon IMAGE: 795.723 5 ‘(AA461577; AA461577.1) (-2,75 ± 0,86); lactotransferrin (LTF) (ANKRD29; NM_173505.2) (-2,28 ± 1,17); HUMNK566 human epidermal keratinocyt-cDNA-klon 566 (ODZ2; D29453.1) (-2,15 ± 1,02); tumornekrosefaktorreceptor superfamilien, medlem 17 (TNFRSF17) (TNFRSF17; NM_001192.2) (-2,07 ± 0,73); og skeletmuskulatur LIM-protein FHL1 mRNA (FHL1; U60115.1). (-2,06 ± 0,87)

Med hensyn til de tre tumor grupper (T1-Grade II, T1-Grade III og T2 /T3-Grade III ), vores analyse ikke viser en delmængde af gener fælles for alle grupper. Derfor undersøgte vi de fælles DE gener mellem par af tumor grupper (tabel S2, S3, S4). DE gener er fælles for alle personer uanset tumor gruppe, blev yderligere grupperet hjælp hierarkisk clustering med euklidiske afstand. Grupper af fælles gener i flere kombinationer er vist i tabel S5

Hierarkisk Clustering med euklidisk Afstand:.. CodeLink Platform

Vi udførte to-vejs gennemsnit-kobling hierarkisk klyngedannelse med euklidisk afstand til ~57 k gener. Et detaljeret billede af prøven klynge dendrogram er vist i figur 2. Vi fordelt tumorerne i to hovedgrupper og flere undergrupper baseret på den differentielle ekspression af deres genom. Den første gren indeholdt en T1-Grade II tumor, og den anden indeholdt tumorer af T1-3-Grade II /III, hvilket yderligere blev samlet i yderligere undergrupper

K-betyder klyngedannelse:. CodeLink Platform.

K-midler clustering algoritme er en anden måde at klassificere data for at finde mønstre af udtryk. Vores analyse var organiseret som følger:

k-hjælp af alle gener og alle prøver. Resultatet af k-means clustering af alle gener og alle prøver er vist i figur 3A. Vi grupperet data i 49 klynger sammen med deres geometriske tyngdepunkter (figur 3B). For hver klynge gruppe var der flere gener, der karakteriserede klyngen dvs. karakteriseret prøven, at generne tilhørte.

k-gennem fælles DE gener i alle prøver. De fælles DE gener blandt alle prøver blev forsat klynger (figur 4A og 4B).

k-hjælp af tumor grupper. Som afslutning på analyse baseret på k-midler klyngedannelse tumor grupper blev analyseret som defineret ovenfor. Resultaterne er vist i figur 5A og 5B for klyngen og centroids hhv. Klynger af tumor grupper afslørede både forskelle samt ligheder mellem de forskellige grupper. For eksempel visse gen kategorier afslørede konstitutive nedregulering i én tumor gruppen versus gruppen af ​​højere trin /kvalitet, mens andre gen kategorier udstillet konstitutive opregulering mellem de tilsvarende grupper (klynger 11, 24, 27, 30, 33, 41, 46). Samtidig omfattede flere klynger gener, der forblev uændret mellem tumor grupper (klynger 21, 26, 35, 37, 45, 47, 48).

K-betyder klynge gav nogle tydelige mønstre blandt prøver , såsom i klynger 1, 3, 4, 5, osv

klynger (A) og centroider (B) er fremlagt, hvor der kan foretages nogen klar sondring mellem de enkelte prøver.

Principal Component Analysis (PCA):. CodeLink Platform

PCA af alle gener i alle prøver. PCA-analyse af vores data blev yderligere udført med henblik på at søge efter andre potentielle mønstre blandt generne. Den indledende analyse blev udført med gener, der var almindeligt de blandt alle prøver. Beregnede hovedkomponenter blev plottet mod hinanden i scatter plots som beskrevet i figur 6. PCA-analyse af generne blev udført for at finde yderligere mønstre i udtrykket data. For at udføre den foreliggende analyse med alle generne og i alle prøver, det indledende trin var at plotte scatter plots af alle kombinationer af hovedkomponenterne (figur 6A, B). Generne manifesteret flere mønstre som bemærket i cirklerne områder i figur 6B. Derefter blev prøver undersøgt for procentdelen af ​​varians de tilskrev hovedkomponenterne (figur 6C, D). Endelig blev en biplot konstrueret for at undersøge klassificering prøve i forhold til den samlede genekspression (fig 6E). Som præsenteret i cirklerne områder i figur 6E blev prøver inddelt i to hovedkategorier: prøver 22A (T2 /T3-Grade III), 27A (T1-grad III) og 29A (T2 /T3-Grade III) på den ene side, og resten af ​​prøverne blev grupperet sammen. For yderligere at løse for forskelle baseret på PCA analyse sammenlignede vi genekspression som følger.

PCA fælles DE gener i alle prøver. PCA-analyse af de fælles DE generne er præsenteret i figur 7. Gruppering af prøverne baseret på hovedkomponenter viste forskellige klassifikationer. Tumor prøver 2A, 3A og 4A blev grupperet udpræget som pr de første tre hovedkomponenter (figur 7E). Disse tre prøver blev grupperet sammen, når den fuldstændige datasæt blev betragtet. Løsning dette resultat med de fælles DE gener viste en forskel mellem tumor grupper. Ligeledes blev flere forskellige grupperinger opnået ved PCA-analyse af de fælles DE generne blandt alle prøver, såsom blandt tumorprøver 22A, 10A, prøver 2A, 4A, 16A, som dannede en separat gruppe og prøver 3A, 17A, 26A, 27A, 29A som dannede en anden (figur 7F). Tilsvarende plotning af komponenter grupperet prøver 3A og 16A, samt prøver 2A, 4A og 10A i en separat gruppe.

PCA af tumor grupper.

Be the first to comment

Leave a Reply