Abstrakt
Kræft i æggestokkene er en sygdom karakteriseret ved komplekse genomiske rearrangementer men størstedelen af de gener, der er målet for disse ændringer forbliver uidentificeret. Bibliografiske disse målgener vil give nyttig indsigt i sygdommen ætiologi og kan give mulighed for at udvikle nye diagnostiske og terapeutiske indgreb. Høj opløsning genom bred kopi nummer og matchende udtryk data fra 68 primære epitelial ovariecarcinomer af forskellige histotypes blev integreret at identificere gener i områder af hyppigste forstærkning med den stærkeste korrelation med udtryk og kopiere nummer. Regioner på kromosomerne 3, 7, 8, og 20 blev hyppigst forøget i kopi nummer ( 40% af prøverne). Inden for disse områder, blev 703/1370 (51%) unikke genekspression probesets differentielt udtrykt, når prøver med gevinst blev sammenlignet med prøver uden gevinst. 30% af disse differentielt udtrykte probesets viste også en stærk positiv korrelation (r≥0.6) mellem ekspression og kopiantal. Vi identificerede også 21 regioner med høj amplitude kopi nummer gevinst, hvor 32 kendte protein kodning gener viste en stærk positiv korrelation mellem udtryk og kopiere nummer. Samlet set vores data validerer tidligere kendte kræft i æggestokkene gener, såsom
ERBB2
, og også identificeret nye potentielle drivkræfter, som
MYNN
,
PUF60
og
TPX2
Henvisning:. Ramakrishna M, Williams LH, Boyle SE, Bearfoot JL, Sridhar A, Speed TP, et al. (2010) Identifikation af Candidate Vækst Fremme Gener i kræft i æggestokkene gennem integreret Copy Nummer og Expression Analysis. PLoS ONE 5 (4): e9983. doi: 10,1371 /journal.pone.0009983
Redaktør: Patrick Tan, Duke-NUS Graduate Medical School, Singapore
Modtaget: Januar 20, 2010; Accepteret: 7 marts 2010; Udgivet: April 8, 2010
Copyright: © 2010 Ramakrishna et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering:. MR er støttet af Cancer Råd Victoria Postgraduate Scholarship. Dette arbejde er finansieret af en bevilling fra National Health og Medical Research Council (NHMRC) Australien (ID: 566.603). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet
Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser
Introduktion
Selv om der er gjort fremskridt med at belyse de molekylære begivenheder, der ligger til grund for udviklingen af kræft i æggestokkene, identiteten af de fleste gener, som driver udviklingen af denne sygdom er fortsat undvigende. Talrige genekspressionsstudier har identificeret lister over gener med væsentligt ændret udtryk, men skuffende er der ikke meget enighed mellem undersøgelser [1]. Mens genekspressionsstudier er nyttige i at identificere brede kategorier af veje ændret i kræft og klinisk vigtige undertyper [2], på egen hånd, kan de ikke være i stand til at skelne de genetisk ændrede centrale driver gener. En alternativ strategi, der anvendes til at identificere føreren gener har været annotation af tilbagevendende kromosomforandringer. Tidlige undersøgelser blev hæmmet fordi teknologier til genom-dækkende genomisk analyse manglede beslutning til tilstrækkeligt forfine cancerassocieret loci [3]. Problemet med beslutningen er blevet overvundet med udvikling af ultra-høj opløsning aCGH og SNP arrays. For nylig har vores gruppe brugt disse nyeste generation SNP arrays at anmærke selv små områder (så lille som 25 kb) af genomisk ændring [4]. Disse data viste også, at de genetiske begivenheder i ovariecancer er mere talrige og komplicerede end tidligere formodet. Mens nogle potentielle driver gener kunne hurtigt identificeres ud fra disse data på grund af deres placering på fokale forandringer, de fleste af tilbagevendende ændringer er store og omfatter en lang række gener.
For at fremskynde identifikation af kræft i æggestokkene vækstfremmende gener, vi har integreret matchende DNA kopital og genekspression data fra en kohorte af 68 primære epithelial ovariecancer. Vi har særligt fokus på gener i områder af kopi nummer gevinst, med den forventning, at ekspressionen af en chauffør gen i en amplikon vil være mere tæt korreleret med genkopital end co-forstærkede gener, hvis udtryk er agnostiker til tumorigenese. Integration af antal kopier og udtryk har fremlagt en liste over kandidat overvejende handler driver gener, som kan bruges til at understøtte funktionel analyse, som vil være nødvendige for at validere deres bidrag til æggestokkene tumorigenese. Desuden forstærkes og over udtrykte gener har potentiale til at tjene som nyttige terapeutiske eller diagnostiske markører for kræft i æggestokkene.
Resultater
Hyppigheden af kopi nummer ændringer (CNA) i æggestokkræft
Vurdering af CNA i 72 epiteliale ovarietumorer (tabel 1, tabel S1) gav i alt 36,534 segmenter omfatter 20,570 KN gevinster og 15,964 KN tab. Det mediane antal regioner med KN gevinst pr tumor var 208, svarende til et gennemsnit på 13,6% af genomet per prøve (tabel S2). Det mediane antal regioner med KN tab var 194 svarende 12,2% af genomet. Disse CNA’er opstod tværs genomet, men der var nogle meget hyppige tilbagevendende regioner CNA blandt de 72 tumorer (Figur 1), herunder gevinster placeret på 1q, 3q, 6, 7q, 8Q, 19 og 20 og tab på kromosomerne 4, 6, 8, 13, 16, 17, 18, 22q og X. Inden epitelial ovariecancer histotypes vi bemærkede, at mucinøs og i mindre grad klare tilfælde celle syntes at have færre CNAs og en mindre andel af genomet var involveret i forhold til de andre subtyper (Figur S1). Men antallet af prøver i de mindre undertyper var små, hvilket gør det vanskeligt at drage statistisk gyldige konklusioner om undertype specifikke ændringer. De fleste af prøverne var af den serøse eller beslægtede høj kvalitet endometrioide undertype og mange af de regioner i gevinst og tab er primært drevet af disse undertyper.
Hyppigheden af forekomsten af genomiske gevinster (gul) og tab (blå) tværs genomet, afbildet i kromosom rækkefølge fra 1p til XQ.
Integration af mRNA-ekspression i regioner af hyppige kopi nummer gevinst
En fælles mekanisme for aktivering af gen-funktion i udvikling af kræft er gennem overekspression som en konsekvens af genamplifikation. Mens mange gener kan være placeret i et bestemt amplicon, ville det målrettede gen (er) forventes at viser konsekvent forhøjet ekspression sammenlignet med tilstødende bystander-gener [5]. Vi har tidligere gennemført en integreret udtryk analyse af kandidat tumorsuppressorgener inden regioner af tab af heterozygositet på en overlappende tumor kohorte [6], og dermed for denne undersøgelse valgte vi at fokusere på identifikation af kandidatgener ligger inden amplikoner. En vilkårlig grænse hyppighed på mindst 40% blev valgt som et filter til valg centrale regioner, hvilket resulterer i afgrænsningen af flere kromosomale regioner på 3. kvartal, 7q, 8Q og 20Q (figur 2). Hvert segment af hyppige KN gevinst var mærket af cytoband den tilhørte; hvorefter regioner med samme cytoband tag blev skjult i en større region (figur S2-A). De regioner overlapper med kimcellelinje kopi nummer polymorfi (CNP’er, tabel S3) blev udelukket som beskrevet i figur S2-B. De sidste 106 amplikoner varierede i størrelse fra 11 kb til 7 Mb (Tabel S4) og 90 af disse regioner i alt indeholdt 1370 genekspression probesets på Affymetrix Gene 1.0ST vifte svarende til 938 kendte protein kodning gener. De øvrige 16 amplikoner ikke var repræsenteret ved probesets på Gene 1.0ST arrays.
Hyppige gevinster forekommer på kromosomer 3, 7, 8 og 20, med hvert punkt angiver frekvensen af gevinst på en KN segment. Den røde linje i alle paneler viser tærsklen på 40% frekvens.
Expression analyser blev udført for probesets inden for hver af de 90 regioner (tabel 2, 3, 4, tabel S5). For hver region grupper af prøver, der viste kopi nummer gevinst (3 eller flere kopier) blev testet for differentieret udtryk mod grupper af prøver, der viste normal kopi nummer (ca. 2 kopier). På tværs af alle regioner, der var 703 (51%) differentielt udtrykte probesets svarende til 629 gener med entydige identifikatorer såsom en HGNC gen symbol eller Ensembl ID (tabel S5). Kun ét gen,
hCG_16001
, viste en negativ log fold ændring (-0,34, figur S3). I gennemsnit (i regioner med mindst 5 probesets), blev 50% af de probesets sig at være differentielt udtrykt antyder en generel stigning i ekspression af gener under KN gevinster. Interessant vi observeret, at
MYC
, et onkogen kendetegnet ved kopiantal gevinst i en lang række forskellige tumortyper, blev ikke signifikant differentielt udtrykt mellem amplificerede og uforstærket grupper af prøver. En mulighed er, at
MYC
udtrykkes på et højt niveau på tværs af alle tumorer uanset kopien nummer status og dermed ikke forskellig mellem grupper af tumorer, der viser en gevinst, og dem der ikke gør. For at teste denne mulighed vi sammenlignet udtryk for
MYC
i forstærkede æggestokkene prøver kræft til udtryk i normal æggeleder epitel. Vi fandt ikke nogen stigning i
MYC
udtryk, når man sammenligner tumorer til disse prøver (p = 0,41, Welch korrigerede uparret t-test, figur S4). Vejviser
for yderligere at forfine denne liste over 703 kopier nummer drevet, differentielt udtrykte probesets, vi ræsonnerede, at de gener, der viser den stærkeste korrelation mellem antal kopier og udtryk kan være de mest sandsynlige gener er omfattet af KN gevinst. Således har vi beregnet korrelationen koefficient for alle differentielt udtrykte gener med kopi nummer probeset dækning i kandidatlandene amplikoner (tabel S5). Af de 692 testede probesets (11 indeholdt ikke kopi nummer sonder), 219 (svarende til 206 protein-kodende gener) viste en stærk positiv korrelation (r≥0.6) mellem udtryk og kopiere nummer.
Gener er omfattet af høj KN forstærkning
Vores vigtigste tilgang til at identificere kræft-relaterede gener var at filtrere for de hyppigste afvigelser, men vi bemærkede, at godt karakteriserede kræft driver gener, såsom
CCNE1
og
ERBB2
[7], ikke blev identificeret, siden de blev amplificeret i mindre end 40% af tumorer. Snarere end at bruge en lavere cut-off, som risikerer herunder mange regioner ændret på grund af generaliseret genomisk ustabilitet (for eksempel ville blive betragtet ~67% af genomet som mulige områder, hvis en afskæring på 10% blev anvendt), vi stedet filtreret for gener, der udviser en høj amplitude CN forstærkning. Her kiggede vi på alle segmenter, der havde en kopi tal større end eller lig med 5 og var til stede i mindst 5 prøver, der er identificeret 21 regioner i løbet af 27,2 Mb (tabel 5). Disse regioner svarede til 181 genekspression probesets på vores Affymetrix Gene 1.0ST arrays, hvoraf 39 (22%) havde en stærk positiv korrelation mellem CN og genekspression (r 0,6). Disse probesets svarede til 32 kendte protein-kodende gener, herunder velkendte kræft driver gener såsom
ERBB2
(tabel S6).
Prioritering lokomotivføreraspiranten gener
For at prioritere de mest lovende kandidater fra de tidligere analyser, vi byggede et gen liste ved hjælp af følgende kriterier. For det første valgte vi disse kendte gener med en høj frekvens af forstærkning ( 40%), der blev differentielt udtrykte (n = 629). Fra denne liste, vi valgte generne mest kraftigt overudtrykt af niveauet af log fold ændring ( 0,7) mellem prøver med KN forstærkning og prøver, der var neutrale på locus (n = 59). Som en anden mål for, hvor genekspression var påvirket af kopi nummer, vi også valgt gener, der viste en stærk korrelation ( 0,7) kopi nummer og udtryk (n = 58). Foreningen af disse kriterier produceret en liste over 110 gener. Fra denne liste identificerede vi gener på hvert kromosom, der var den hyppigst påvirket af kopiantal ændringer; for CHR8, omfattede dette gener med en frekvens på ≥60%, for CHR3, ≥50% og for chr20 ≥42%. Denne liste omfattede 37 gener (tabel 6).
For det andet, vi ønskede også at omfatte gener, der var stærkt forstærket. Fra vores liste over højt forstærkede gener i mindst 5 prøver vi valgt dem, der havde en stærk positiv korrelation mellem antal kopier og udtryk (r 0,6, n = 32). Nogle af de gener, der var stærkt amplificerede blev også differentielt udtrykt baseret på ekspressionen analyse med ofte opnået regioner, så vi også medtaget gener med en log gange ændring større end 0,6 (n = 17). Tager gener opfylder den ene eller den anden af disse kriterier, vi tilføjet 41 gener til vores højt prioriteret liste (tabel 6).
Når vi kombineret disse to gen-lister, den første er baseret på “højfrekvent”, og den anden på “høj amplitude”, men begge med forøget ekspression, det endelige antal unikke gener var 70 (tabel 6).
diskussion
genanalyse har været meget anvendt til at identificere de vigtigste veje og klinisk vigtige undergrupper i kræft i æggestokkene, men identifikation af specifikke driver gener ved anvendelse alene denne metode har været hæmmet af, at udtrykket er snarere plast og der har været lidt konsensus i generne identificeret mellem sådanne undersøgelser [1], [8]. En årsag til denne mangel på konsekvens er, at de fleste undersøgelser har analyseret RNA fra hele tumor prøver uden kontrol af den procentvise kræft epitel og /eller har brugt diverse kontrol- væv såsom hele jorden æggestok [9]. I modsætning til genekspression, kan genomiske ændringer være en mere stabil og pålidelig prædiktor for placeringen af førerens gener. Kræft i æggestokkene har længe været mistænkt for at være cytogenetisk kompleks [10] og de seneste fremskridt inden for genomforskning teknologi har bekræftet de dybtgående genomiske afvigelser, der karakteriserer de fleste ovariecancer [4], [11], [12], [13]. På trods af denne kompleksitet, offentliggjorte kopital profiler af ovariecancer er meget sammenlignelige på globalt plan [3] og mange undersøgelser har identificeret meget lignende regioner af hyppige kopi nummer ændring. Imidlertid har fremskridtene på at identificere de vigtigste driver gener været langsom, med forskellige undersøgelser ofte identificere forskellige kandidater i den samme genomiske region. For eksempel har det kromosom 20 amplicon driver skiftevis blevet foreslået at være
ADRM1
[14],
EYA2
[15],
AURKA
ZNF217
[16], blandt flere andre. Tidlige studier integrerer udtryk og kopi nummer data har enten brugt kræftceller til at identificere løbet udtrykte gener [17], [18] og /eller microarray platforme med begrænset opløsning og genom-dækning [19], [20]. Til dato få studier har udnyttet en virkelig genom-dækkende integreret kopi nummer og udtryk analyse på matchede prøver til den fordomsfri identifikation af kandidatgener [21], [22], [23], og der har kun været én tidligere undersøgelse af en mindre gruppe af ovarietumorer [12]. I denne undersøgelse har vi derfor forsøgt at omgå nogle af de spørgsmål med behandlingen udtryk eller kopiere nummer i isolation ved at integrere to datasæt opnået fra Mikrodissekterede tumor epitelceller.
Som et første hovedet af de data, vi fokuseret på gevinster forekommer i en meget høj andel af sager, som omfattede regioner af kromosomer 3, 7, 8 og 20. Identifikation af differentielt udtrykte gener reduceret vores liste over kandidat cancer gener i disse regioner med ca. halvdelen (interval 6-89% for regioner med mindst 5 probesets). Vi har valideret flere af generne identificeret i Haverty
et al
., For eksempel på 3q26.2 Vi bekræftede forøget ekspression i 7/8 af deres gener. Men vi har også identificeret en række yderligere forstærket og mere end udtrykte gener (tabel 2, 3, 4), sandsynligvis på grund af forskelle i vores metode og større stikprøve. Andelen af differentielt udtrykte gener i vores undersøgelse er i overensstemmelse med tidligere undersøgelser af andre cancertyper [24] støtter det koncept, at kopiantal kan have stor indflydelse på genekspression. Derfor for mange regioner, vi var ikke i stand til at identificere en bestemt driver gen. Det er muligt, at der virkelig kan være mange driver gener i hvert amplikon og selv om hver individuelt kan bidrage lidt til cancer progression, koordinere overekspression af disse gener i opformerede regioner kan have en additiv eller synergistisk oncogen effekt. Alternativt kan mange af de differentielt udtrykte gener være passagerer, hvis overekspression forlener nogen selektiv fordel eller ulempe for tumoren. Diskriminere mellem passagerer og chauffører i en genomisk region kan derfor kun opnås gennem store funktionelle analyser og kombinatoriske tilgange undersøger mange gener i koncert.
På trods af det forholdsvis store antal forstærkede og differentielt udtrykte gener er identificeret i denne undersøgelse vi stadig hypotese, at de gener, der viser de stærkeste overekspression, og også de gener med de højeste amplitude kopital gevinster, kan være mere tilbøjelige til at være førere af tumorigenese end svagt i løbet udtrykte gener. Derfor har vi prioriteret vores gen listen med stringente udtryk kriterier. For eksempel er en af de gener, der hyppigst ramt af kopi nummer, der er kraftigt i udtryk er
PUF60
(
poly-U bindende splejsning faktor 60 kDa
). Dette gen koder for et præ-mRNA splejsning faktor menes at være involveret i anerkendelse af 3 ‘splejsningssites [25]. Det kan også inhibere transkription ved interaktion med TFIIH helicase, den vigtigste faktor muteret i cancer-tilbøjelige syndrom xeroderma pigmentosum, og denne interaktion er impliceret i den korrekte regulering af
MYC
transkription [26], [27] .
Myoneurin eller
MYNN
er et gen, der er beliggende i et område med hyppige (60%) kopi nummer gevinst på 3q26.2. Det er differentielt udtrykt (justeret p = 1.51E-05) mellem amplificerede og uforstærket grupper, og viser den stærkeste korrelation mellem kopital og ekspression (r = 0,74, figur 3) blandt alle gener i denne region. Dette gen blev identificeret som et medlem af de overordnede komplekse, Tramtrack, Bric en ‘Brac (BTB) eller poxvirus og zink finger (POZ) -ZF dvs. BTB /POZ-ZF familie af transkriptionsfaktorer [28]. Først opdaget i
Drosophila
, denne familie består af cirka 60 humane proteiner herunder flere kræftrelaterede proteiner, såsom leukæmi relateret faktor (LRF /ZBTB7) og B-celle-lymfom 6 (BCL6). Mens er endnu ikke præget rolle MYNN i kræft, andre medlemmer af denne familie tilsvarende overudtrykt i tumorer [29].
A. Hyppigheden af kopi nummer gevinst på kromosom 3 fra p-ter til venstre for q-ter til højre som angivet af ideogram. B. Gener på CHR3: 169,209 til 172,478 Mbp, en region opnået i 60% (41/68) af alle prøver, herunder gener, der tidligere er forbundet med kræft i æggestokkene (
PRKCI, Mecom
eller
mds1 /EVI1
) og potentielt nye onkogener (
MYNN
). C. En vulkan plot præsentere resultaterne af udtryk analyser mellem forstærket og uforstærket prøver i denne region. Generne i øverste højre hjørne er signifikant overudtrykt i prøver med kopi nummer gevinst (p 0,05; over den røde linje på -logP 4.32) sammenlignet med prøver uden kopi nummer ændring (udvalgte gener er mærket). For komplet liste over differentielt udtrykte gener se tabel S5. D. Plot sammenligne antal kopier og udtryk i alle prøver for genet
MYNN Hoteller, som viste den højeste korrelation (r = 0,74, Pearsons test) mellem kopi nummer og udtryk for denne region på 3q26.2.
Udover at identificere høj frekvens, differentielt udtrykte gener, herunder kendte cancer gener såsom
PIK3CA
AURKA
, vi også brugt høj amplitude regioner til at finde yderligere kendt ( fx
ERBB2
CCNE1
) og potentielle onkogener. For eksempel på kromosom 20, høj-amplitude tilgang identificeret en lille minimal region, der ikke klart af den lave amplitude analyse. Dette 421 kb interval 20q11.21 omfatter 10 gener, hvoraf
TPX2
viste den stærkeste korrelation med kopi nummer (r = 0,53). Dette gen blev også differentielt udtrykt mellem prøver med nogen
TPX2
gevinst og dem med normal
TPX2
kopi nummer, og havde den stærkeste fold ændring af enhver gen på kromosom 20 (log2 fold ændring på 1,03 ). Proteinet kodet af dette gen fungerer som en aktivator af Aurora-A med en rolle i spindelenhed [30]. Interessant for ovariecancer, er det blevet vist at interagere med BRCA1 /BARD1 kompleks (15). For nylig er det blevet identificeret som et potentielt onkogen i pancreascancer [31].
Sammenfattende vores undersøgelse viser, at kombinere høj frekvens og høj amplitude analyser og målrette den mest kraftigt i udtrykte gener reducerede kandidatlisten til kun 70 gener ud af de mange tusinde målrettet mod kopiantal ændring alene. Vi har identificeret mange lovende kandidatgener ikke tidligere bemærket i kræft i æggestokkene, især gener såsom
MYNN
,
TPX2
og
PUF60
. Det skal dog bemærkes, at vores fremgangsmåde til analyse er en af mange, der kan anvendes i identifikationen af hidtil ukendte cancer-gener, og forventes ikke at have identificeret alle mulige kandidater. Eksemplet med
MYC
, ikke stærkt til udtryk i vores data, men tidligere vist sig at have en funktionel effekt i æggestokkene kræftceller [32], viser klart, at vores tilgang bør overvejes et supplement til andre, såsom funktionelle skærme og dyb sekventering af primære cancer prøver. Ikke desto mindre vores data giver en vigtig platform, hvorfra man rationelt forfølge valideringen af disse potentielle dominante førere af æggestokkene tumorigenese. Desuden kan denne liste indeholde gener, der er gyldige kandidater til diagnostiske eller terapeutiske formål.
Materialer og metoder
Etik Statement
Alle prøver blev indsamlet med donorens skriftligt informeret samtykke. Denne undersøgelse blev godkendt af Peter MacCallum Cancer Centre menneskelige Research Ethics Committee (Protokol nummer 01/38).
prøvetagning
Tumor biopsier blev opnået fra 72 patienter, der blev undergår kirurgi for primær ovariecancer kræft (a) ved hospitaler i Wessex-regionen i det sydøstlige England, UK og (b) på hospitaler i Victoria, Australien (adgang til via Peter MacCallum Cancer Centre Tissue Bank). Blod blev opsamlet fra de samme patienter efter matchende lymfocytter. Æggeleder prøver blev indsamlet gennem vævet bank fra
BRCA1
eller
BRCA2
mutationsbærere gennemgår profylaktisk bilateral salpingo-ooforektomi på hospitaler rundt Melbourne. Den optjening og brug af patientprøver relateret til dette projekt blev godkendt af de relevante institutionelle etiske råd. Klinisk og histopatologisk information om prøverne er angivet i tabel 1 og tabel S1.
DNA og RNA-ekstraktion
Fresh-frossen væv blev indlejret i Optimal Cutting Temperatur Forbindelse (OLT Sakura Finetek, Torrance , CA) og skåret i 10 um snit. Tumor-DNA og tumor og æggeleder RNA blev ekstraheret fra identiske regioner efter nålen mikro-dissektion af 80% tumor epitelceller. Profiler til RNA blev farvet under anvendelse af cresylviolet og RNA blev ekstraheret under anvendelse Ambion Mirvana total RNA-ekstraktion protokol (Applied Biosystems /Ambion, Austin, TX). Vævssnit anvendes til DNA-ekstraktion blev farvet med hæmatoxylin og eosin, og DNA blev ekstraheret under anvendelse af Qiagen Blood and Tissue Kit (Qiagen, Valencia, CA, USA). DNA fra matchende normale lymfocytter for prøver fra Peter MacCallum Cancer Centre Tissue Bank blev udvundet ved hjælp af den samme kit. DNA fra matchende normale lymfocytter for prøver fra Southampton blev ekstraheret som beskrevet tidligere [33].
Microarray datagenerering og kvalitetskontrol
500 ng DNA fra hver tumor prøve blev analyseret ved anvendelse af Affymetrix Genome -dækkende Humant SNP Array 6.0 (SNP6.0) ifølge producentens instruktioner (Affymetrix, Santa Clara, CA). Hvor findes (57 tilfælde) DNA fra matchende perifere blodlymfocytter blev analyseret på samme platform og i samme parti. For mRNA-ekspression, blev 300 ng af totalt RNA fra de samme tumorprøver analyseret ved anvendelse af Affymetrix Humant Gene1.0 ST Array. Analyse af matrix ydeevne til SNP6.0 arrays blev udført ved hjælp af genotype takster ( 90% takst påkrævet) og også visuel inspektion af kopi nummer spor at fjerne støjende prøver. 72 prøver bestået kvalitetskontrol foranstaltninger og blev anvendt i kopiantallet analyse. For udtryk arrays, profiler af hybridisering kontrol, spike-in kontrol og positiv-versus-negative område under kurven (AUC) blev vurderet ved hjælp af Affymetrix Expression Console. Desuden blev kvaliteten af arrays vurderet ud fra Relativ Log-Sandsynlighed (RLE) og Normaliseret Ikke skalérbart standardfejl (nBrug) kriterier genereres ved hjælp af “affyPLM” pakke i open source software R. Expression arrays, der blev markeret som tvivlsomme ved 2 ud af 3 foranstaltninger (AUC, RLE, nBrug) blev ekskluderet fra udtryk analyser. 68 tumor prøver (57 med normal DNA) bestået for både udtryk og kopi nummer og blev fastholdt i den integrerede udtryk analyser. Den endelige prøve sat i den integrerede analyse omfattede de fire mest almindeligt set histologiske undertyper af kræft i æggestokkene – serøs (n = 37), endometrioide (n = 14), mucinøs (n = 7) og klar celle (n = 9). Én prøve i undersøgelsen var af ukendt histotype (tabel 1). Både genekspression og kopi nummer data er MIAME kompatibel og er blevet forelagt det nationale center for bioteknologi Informations (NCBI) Gene Expression Omnibus (GEO) hjemmeside, serie tiltrædelse nummer GSE19539.
Kopier nummer analyse
Kopier tal generation og analyser blev udført ved hjælp af Partek
® Genomics Suite ™ version 6.03 (Partek Inc., St. Louis, Missouri) og BioConductor pakker i source framework R-open [34], [35]. SNP 6.0 CEL filer blev importeret til Partek ved hjælp af standardindstillinger for baggrunden korrektion og sammenfatning. Human Genome Build 36,1 (hg18 marts 2006) blev anvendt til basepar steder. Probeset kopi nummer nøgletal blev beregnet ved at sammenligne hver tumor med sin matchende normal når tilgængelige (n = 57). For prøver, der ikke havde matchende normale data (n = 15), en pooled normal baseline fra alle de andre normale prøver blev brugt. Cirkulære binær segmentering [36] blev udført ved hjælp af R-baserede pakke “DNAcopy” til segmentet data i forskellige regioner af forandringer ved hjælp standard pakke indstillinger. Denne analyse produceret en liste over regioner per prøve, der derefter blev filtreret for de regioner, der viste gevinst (kopi nummer forholdet 2,5) eller tab (kopitalsforholdet 1,5) på tværs ≥40% (n≥29) af alle prøver. Disse regioner kollapsede i cytobands for lettere data manipulation (figur S2 for flere detaljer). Det er vigtigt at bemærke, at eftersom disse regioner har gennemgået filtrering trinene ovenfor definerede, de ikke omfatte hele cytoband, som de er repræsenteret, og dermed den høje opløsning af data ikke kompromitteres.
For at identificere potentielle kimcellelinje kopi nummer polymorfier (CNP), som kan forstyrre præcis identifikation af somatiske ændringer, kopiere nummer data for 57 normale prøver blev genereret i forhold til en pooled baseline af alle normale prøver. Regioner viser gevinst eller tab i 5% af alle prøver blev kaldet som CNP’er (tabel S3). Regioner af interesse fra tumor data blev scannet for disse CNP’er og kampe blev fjernet fra downstream analyser (Figur S2-B). CNP-fjernede, cytoband-kollapsede regioner blev forespurgt mod hele kopi-nummer datasæt til at generere nøjagtige, region-wise værdier kopi nummer.
Kopiér nummer blev ekstraheret på et gen-for-gen-basis til at udføre Pearson korrelationsanalyse med ekspression. Da nogle gener var så lille, at der ikke var nogen kopi nummer probesets kortlægning til dem, yderligere 10 kb blev tilføjet til alle gen start og stop positioner, før udtrække deres kopi nummer.
Expression microarray analyse
for hver kandidat region blev prøver opdelt i to grupper, G – bestående af alle prøver, der viste gevinst ( 3 eksemplarer) på SNP6.0 platform; og N – bestående af alle prøver, der viste normale kopital (1,5-2,5 kopier). En test for differentiel ekspression blev udført mellem disse to grupper ved hjælp af “limma” pakke tilgængelig på R-open source software platform [34]. Histologisk undertype blev inkluderet som en faktor i analysen. Gener blev anset for at være væsentligt forskelligt udtrykkes med en p-værdi på 0,05 efter flere test korrektion [37]. En Pearsons korrelationsanalyse mellem kopi nummer og udtryk blev også udført. Separate analyser blev udført på et gen-for-gen basis for alle gener i (a) hyppigst forstærket regioner (CN≥3; Freq≥40%) og (b) mest forstærkede regioner (CN≥5; Freq≥7% ).
Støtte Information
tabel S1.
Sample detaljer. Klinisk-patologisk funktioner og analyse for hver prøve. 57 ud af 72 tumorer havde matchende lymfatisk DNA til rådighed for kopi nummer microarray analyse
doi:. 10,1371 /journal.pone.0009983.s001
(0,06 MB PDF)
tabel S2.
Andel af genom-dækkende gevinst og tab ved prøven. I alle disse prøver, det uregelmæssige genom tilføjer op til 95,4% i gennemsnit. De manglende 4,6% kan henføres til regioner på kromosom Y, mitokondrie-DNA og repetitive sekvenser omkring centromere regioner, der enten fjernet fra segmentering analyse eller ikke er dækket af Affymetrix SNP6.0 vifte
doi:. 10,1371 /journal.pone .0009983.s002
(0,06 MB PDF)
tabel S3.
Kimcellelinje kopi nummer polymorfier på Chr 3, 7, 8, 20. regioner /segmenter af kopi nummer gevinst, der indeholdt et eller flere af disse CNP’er blev fjernet eller ændret som vist i figur S1-B. Den type CNP vises også i kolonnen længst til højre
doi:. 10,1371 /journal.pone.0009983.s003
(0,05 MB PDF)
Tabel S4. Salg regioner gevinst til stede i 40% af prøverne. Denne tabel indeholder genomisk information til de 90 regioner, der indgår i udtrykket analyser, dvs. alle de regioner, kortlagt til 1 eller flere probesets om det humane GeneST1.0 mikroarrays. På denne microarray platform, de fleste probesets kort entydigt til et protein-kodende gen. Regionen id’er svarer til dem i tabel 2, 3, 4 og S5
doi:. 10,1371 /journal.pone.0009983.s004
(0,13 MB PDF)
tabel S5.
Alle differentielt udtrykte probesets i hyppige regioner af gevinst.
Leave a Reply
Du skal være logget ind for at skrive en kommentar.