Abstrakt
Genetiske varianter beliggende inden for 12p13.33 /
RAD52
locus har været forbundet med lunge planocellulært karcinom (LUSC). Her inden 5.947 UADT kræft og 7,789 kontroller fra 9 forskellige undersøgelser, fandt vi rs10849605, en fælles intron variant i
RAD52
, der også er forbundet med øvre aerodigestive tarmkanalen (UADT) pladecellekarcinom tilfælde (OR = 1,09 , 95% CI: 1.04-1.15, p = 6×10
-4). Vi har desuden identificeret rs10849605 som
RAD52 cis
-eQTL inUADT (p = 1×10
-3) og LUSC (p = 9×10
-4) tumorer, med UADT /LUSC risiko allel korreleret med øget
RAD52
ekspressionsniveauerne. Den 12p13.33 locus, der omfatter rs10849605 /
RAD52
, blev identificeret som en væsentlig somatisk omdrejningspunkt kopi nummer forstærkning i UADT (n = 374, q-værdi = 0,075) og LUSC (n = 464, q-værdi = 0,007) tumorer og korreleret med højere
RAD52
tumor ekspressionsniveauerne (p = 6×10
-48 og p = 3×10
-29 i UADT og LUSC henholdsvis). I kombination, implicerer disse resultater forøget
RAD52
udtryk i både genetisk modtagelighed og tumorigenese af UADT og LUSC tumorer
Citation:. Delahaye-Sourdeix M, Oliver J, Timofeeva MN, Gaborieau V, Johansson M, Chabrier A, et al. (2015) Den 12p13.33 /
RAD52
Locus og genetisk disposition for planocellulært Kræft i Øvre Aerodigestive Tract. PLoS ONE 10 (3): e0117639. doi: 10,1371 /journal.pone.0117639
Academic Redaktør: Amanda Ewart Toland, Ohio State University Medical Center, UNITED STATES
Modtaget: 16. juli 2014 Accepteret: December 29, 2014; Udgivet: 20 Marts 2015
Copyright: © 2015 Delahaye-Sourdeix et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Data Tilgængelighed: Alle relevante data er inden for papir og dens Støtte Information filer
Finansiering:. Finansiering af studier koordinering, genotypning af replikation undersøgelser og statistisk analyse blev leveret af det amerikanske National Institutes of Health (R01 CA092039 05 /05S1) og National Institute af Dental og kraniofaciale Research (1R03DE020116). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet
Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser
Introduktion
Øvre aerodigestive tarmkanalen (UADT) kræftformer, bestående af mundhulen, svælget og spiserøret, er den fjerde mest almindelige årsag til kræft død på verdensplan [1]. Mens forbruget af tobak og alkohol er de vigtigste UADT kræftformer risikofaktorer [2], er genetisk modtagelighed blevet hypotese at spille en rolle i patogenesen af denne sygdom [3,4].
Udsættelse for tobak og alkohol fører til celleskader og DNA forandringer, der i mangel af passende reparation, kan forårsage cellecyklus deregulering og kræft udvikling [5,6]. Homolog rekombination (HR) er en vigtig måde, hvorpå celler reparere DNA-læsioner [7,8].
RAD52
gen er involveret i homolog rekombination DNA-reparation proces [9] af medierende RAD51, en central HR-gen, der danner en spiralformet glødetråd nukleoprotein involveret i søgningen efter homologi og streng parring [10].
genom forbindelsesundersøgelser (GWAS) har impliceret den rs10849605 genetisk variant ved 12p13.33, locus, der omfatter
RAD52
i det humane genom, til at være forbundet med en beskeden, men statistisk signifikant, forøget risiko for lungekræft [11,12]. Det ser mest relevante for lunge pladecellekræft (LUSC) og småcellet lungekræft, men med lidt dokumentation inden for lunge adenokarcinomer (LUAD) [11,12]. Selvom de molekylære mekanismer, der bidrager til indvielse og progression er stadig dårligt forstået, planocellulært karcinom (SCC) af forskellige anatomiske steder deler mange fænotypiske og molekylære karakteristika med hinanden [13]. Formålet med denne undersøgelse var at undersøge
RAD52
i forbindelse med genetisk disposition for SCC af UADT, at undersøge, hvordan denne forening kan være medieret, og undersøge de somatiske mutation begivenheder på
RAD52
12p13.33 locus.
Materialer og Metoder
undersøgelse emner
i alt 9 case-kontrol studier af UADT kræft deltog i vores nuværende studie i alt 5.947 UADT kræfttilfælde og 7,789 kontroller. Undersøgelse designs og befolkningsmæssige karakteristika er blevet beskrevet i flere detaljer tidligere [3,14,15] og er kort beskrevet i tabel 1. I de fleste undersøgelser, kontrolpersonerne var frekvens matchet til sager om alder, køn og andre faktorer (f.eks , undersøgelse stedet og hospital). Skriftligt informeret samtykke blev opnået fra alle forsøgspersonerne, og de undersøgelser, blev godkendt af de institutionelle anmeldelse bestyrelser på hver studiecenter. Analyse var begrænset til planocellulært karcinom.
Genotypning
rs10849605 blev genotype hjælp Illumina perle arrays eller TaqMan genotypebestemmelse (C__1244798_10, Applied Biosystems, Carlsbad, CA) ved IARC som beskrevet andetsteds [3]. Udførelsen af Taqman assays blev valideret af re-genotype prøver med kendt genotype (f.eks HapMap). Den genotype fordeling var i overensstemmelse med det forventede ved Hardy-Weinberg ligevægt i de enkelte lande /studie. Alle efterfølgende genotypning opnåede en intern undersøgelse to eksemplarer konkordans på . 99%
The Cancer Genome Atlas data
Vi adgang til hoved og hals pladecellecarcinom (HNSC), Lung planocellulært carcinom (LUSC) og lungeadenokarcinom (LUAD) komponenter af TCGA data (TCGA Projekt nummer # 3230 og # 2731). Disse data er tilgængelige ved hjælp af dbGAP via TGCA (https://tcga-data.nci.nih.gov/tcga/). Data blev hentet enten fra https://cghub.ucsc.edu/for exome sekventering eller direkte fra https://tcga-data.nci.nih.gov/tcga/for dataene RNA sekventering, methylering og genotype.
Exome sekventering.
Vi adgang TCGA exome sekventering “niveau 1” (uforarbejdede) data for 363 HNSC og 459 LUSC TCGA enkeltpersoner og afsluttet bioinformatik analyse af deres sekvens data ved hjælp af Picard, GATK, MuTect og somatisk Indel detektor (Metode A i S1 File). Efterfølgende brugte vi i hus bioinformatik rørledninger (Methods A i S1 fil) til at bestemme den højeste kvalitet variant opkald. Somatiske punktmutationer var exoniske funktionelle varianter defineret som enten afkortning, påvirker splejsning eller missense varianter forudsagt som skadelig ved SIFT /POLYPHEN2 [16,17].
Kopier nummer Variation.
Prøverne blev hybridiseret hjælp Genome Wide Menneskelig SNP Array 6.0 platform på Genome Analyse platform af de overordnede Institut. Vi hentede niveau 3 TCGA data for 374 HNSC, 464 LUSC og 476 LUAD individer indeholder normaliseret log
2 forhold mellem fluorescensintensiteterne mellem målstikprøven og en reference prøve. Vi kun inkluderet i vores analyse individer, for hvem både tumor og tilsvarende normale opkald var til rådighed. For et segment, betragtede vi log
2 (ratio) -0,5 Til at være en indikation af et tab, og en log
2 (ratio) 0,5 for at indikere en gevinst. Segmenter med log
2 (ratio) på mellem -0,5 og 0,5 blev ikke bevaret som somatisk kopi nummer ændringer. Annotation blev færdig med at tilføje generne, der er indeholdt i hver af de resterende segmenter ved hjælp Ensembl databaser [18].
RNA-sekventering.
RNA-sekventering (RNA-seq) TCGA data hentet “niveau 3 “data for 263 HNSC, 223 LUSC og 125 LUAD individer. Normalisering af disse data er nærmere beskrevet i metoder Statistiknomenklaturen.
Methylering.
TCGA methylering data blev analyseret på Illumina Infinium HumanMethylation 450K BeadChip assay. Vi adgang TCGA methylering “niveau 2” data for 263 HNSC, 223 LUSC og 125 LUAD individer. Vi anslået den methylerede for hver CpG sted ved at beregne M-værdi (log
2 (forholdet mellem methylerede og umethylerede sonder)) ved hjælp af TCGA niveau 2-data [19]. Methylering niveau 2 data allerede baggrund-korrigeret.
rs10849605 TCGA genotyper.
rs10849605 er placeret inde i 5′-området af
RAD52
og var ikke omfattet af exome sekventering. Derfor afledt vi genotyperne for 263 HNSC, 223 LUSC og 125 LUAD individer ved hjælp af Affymetrix 6.0 SNP-array TCGA data.
Statistiske metoder
Association analyse.
Sammenhængen mellem den varianter og UADT kræftrisiko blev estimeret ved odds ratio (periferi) og 95% konfidensintervaller (CIS) pr allel under log-additive model og genotype stammer fra multivariat ubetinget logistisk regression, med sex og studere specifikke oprindelsesland indgår i model som kovariater (S1 tabel). Heterogenitet yderste periferi blev vurderet ved hjælp af Cochran Q test. Statistiske analyser blev udført ved hjælp af SAS-version 9.3 (SAS Institute, Cary, NC, USA).
For at kontrollere for potentielle etniske heterogenitet mellem cases og kontroller, vi udførte en principal komponenter analyse ved hjælp af EIGENSTRAT pakke af EIGENSOFT 5.0 software [20] ved hjælp af 12,898 markører i lav koblingsuligevægt [21]. Vi brugte de resulterende 12 statistisk signifikante eigen vektorer (som defineret i Tracy-Widom statistik) i følsomhedsanalysen (tabel A i S1 File).
eQTL analyser.
Sammenhængen mellem rs10849605 kimcellelinje genotype og
RAD52
tumor udtryk niveauer (eQTL) blev testet på 263 HNSC, 223 LUSC og 125 LUAD ved hjælp af en lineær model. Det er gentagne gange blevet observeret, at tumorer erhverve somatiske ændringer, der også kan påvirke genekspression, især kopiantals ændringer og DNA methylering [22-24]. Derfor testede vi eQTL effekt rs10849605 på
RAD52
tumor udtryk ved hjælp af både korrigerede og ikke-korrigerede lineære modeller som beskrevet i tabel B i S1 Filer. Disse statistiske analyser blev udført ved hjælp af R statistisk software (R Foundation for Statistisk Computing, https://www.R-project.org).
For at styre for virkningen af befolkningens heterogenitet, udledte vi befolkning struktur af 263 HNSC, 223 LUSC og 125 LUAD TCGA tilfælde med struktur software [25] ved hjælp Hapmap release # 23 som reference befolkning [26] og begrænsede eQTL analyser til 215 HNSC, 192 LUSC og 113 LUAD sager forventes at være af europæisk herkomst (CEU 0,8). På disse, vi yderligere gennemført en principal komponenter analyse ligner den GWAS én. De resulterende betydelige eigen vektorer (som defineret af Tracy-Widom statistik) blev anvendt i eQTL følsomhedsanalyse (tabel C i S1 File).
Kopier nummer analyse-transportcenter.
Vi brugte en offentligt tilgængelige metode, kaldet Genomisk Identifikation af væsentlige mål i Cancer (transportcenter) [27,28], version 2.0 for at finde de væsentligt forstærkede eller slettede regioner bruger TCGA kopi nummer data. Den transportcenter algoritmen beregner p-værdier for hver markør ved at sammenligne scoren på hvert locus til en score baggrund fordeling genereret ved tilfældig permutation af markørplaceringer i hver prøve. Så rette p-værdier for flere hypotesetest ved hjælp af Benjamini-Hochberg falsk opdagelse sats (FDR) metode. Derfor transportcenter scores repræsenterer signifikansniveauer og udtrykkes som Q-værdier (væsentlige under 0,25).
RNA-sekventering normalisering.
niveau 3-RNA-sekventering tumor data, som vi tilgås fra TCGA var allerede normaliseret til kilobase per million læser (RPKM) standard, som korrigerer for arterne længde og læse dybde [29], men ikke for mangfoldighed af RNA befolkning. For at kontrollere for dette vi anvendte TMM (Trimmet Mean af M-værdier) normalisering [30] til de RPKM data. Dette muligvis indebærer et tab af statistisk effektivitet i forhold til at anvende TMM til rådata, da præcision vægtning i TMM vil ikke længere fungere. Det bør dog ikke tilføje nogen bias og tab af effektivitet vil være små, hvis de læste massefylde er tæt på ensartet. Vi brugte implementeringer i Edger pakke af BioConductor [31] og voom funktion BioConductor limma pakke [32]. De normale udtryk data bliver kun tilgængelig for et par tilfælde, var det ikke muligt at udføre en differentieret udtryk analyse.
Resultater
Kimcellelinje genetisk variation rs10849605 og modtagelighed for UADT kræft
Vi genotype rs10849605 i 5.947 UADT kræfttilfælde og 7,789 kontrol personer fra 9 studier. Hyppigheden af den mindre allel af rs10849605 varierede noget efter land, med risiko allel (C) er mere udbredt i Europa og Latinamerika sammenlignet med Asien (51% og 49% mod 40%).
Som observeret i pladecellecarcinom i lungen, blev C-allel forbundet med en beskeden stigning i UADT kræftrisiko (fig. 1, p = 6×10
-4), med odds ratio (OR) for at have en yderligere risiko allel være 1,09 (95% CI: 1,04-1,15). Foreningen optrådte relativt konsistent på tværs af geografisk område (fig. 1), og syntes ikke følsom over for kryptisk befolkning struktur i 1.791 sager og 2.531 kontroller hvor genom bred data var til rådighed til at udlede den genetiske herkomst (tabel A i S1 File). Foreningen var også konsistente inden UADT kræft underordnede og forbrug af tobak. Det var dog mere fremtrædende i dem, drukket alkohol i forhold til ikke-drikkende (p_het 0,03) (fig. 1). Der var lidt, der tyder på denne variant ændrede forbrugsmønstre af tobak og alkohol (p = 0,53 og p = 0,40, henholdsvis pack /år og ethanol /dag taget som en kontinuerlig variabel).
Squares repræsenterer yderste periferi, størrelse af pladsen repræsenterer den inverse af variansen af log yderste periferi, vandrette linjer repræsenterer 95% kreditinstitutter. Det faste lodrette linje angiver OR = 1 og den stiplede lodrette linje overordnede eller under log-additive model. p_het er p-værdien for heterogenitet mellem de forskellige undergrupper. I2 er% af observerede variation på tværs af undergrupper (negativ I2 blev sat til 0).
Integreret
i-silico
fine kortlægning af 12p13.33 locus
Vi næste påtog
i-silico
analyse af rs10849605 variant og
RAD52
/12p13.33 locus i kræftformer hoved og hals og lunge genomisk karakteriseret ved Cancer Genome Atlas (TCGA) .
Expression kvantitativ egenskab locus (eQTL) af rs10849605 i HNSC og LUSC
rs10849605 ligger i nærheden af formodede promotor 5 ‘for
RAD52
gen, derfor har vi en hypotese, at dette, eller en korreleret proxy variant, kan have indflydelse på
RAD52
genekspression. Vi udførte et udtryk kvantitativ egenskab locus (eQTL) analyse mellem rs10849605 og
RAD52
ekspressionsniveauerne i HNSC (n = 263), ved hjælp af data, hvor både RNAseq af tumorerne og genotypning var blevet udført af TCGA inden for samme individer. rs10849605 var signifikant associeret med
RAD52
genekspression niveauer i HNSC (fig. 2, n = 263, p = 9×10
-4), tyder på, at rs10849605 er en
cis
-eQTL locus for
RAD52
. C allel af rs10849605, der er forbundet med risiko for HNSC blev korreleret med øget
RAD52
ekspressionsniveauerne (fig. 2). Foreningen var ikke følsom enten justering for somatiske begivenheder (kopi nummer eller methylering status, som kan påvirke eQTL analyse i tumorer [22]), HNSC undertype (larynx /hypopharynx, mundhulen, oropharynx) eller befolkningens struktur (tabel B og C i S1 fil). En tilsvarende virkning iagttoges i LUSC (fig. 2, n = 223, p = 8×10
-4), men ingen klar eQTL association blev observeret i lunge adenocarcinom (LUAD, fig. 2, n = 125, p = 0,75) . Mens statistisk signifikant, at eQTL for rs10849605 udgjorde kun en lille del af variansen (ca. 4%) i
RAD52
udtryk i HNSC og LUSC tumorer, en observation i tråd med den relativt beskedne genetiske risiko observeret med dette variant.
Boxplots viser effekten af genotypen for SNP
RAD52
rs10849605 på
RAD52
tumor ekspressionsniveauer i HNSC, LUSC og LUAD. Risikoen allel (C) øger
RAD52
udtryk niveauer (p = 9×10
-4 og 8×10
-4 henholdsvis) i begge skællede kræftformer, men ikke i lunge adenocarcinom (p = 0,75). I modsætning hertil var der ingen evidens for sammenhæng mellem rs10849605 og ekspressionsniveauer af andre gener i 12p13.33 regionen (tabel D S1 File).
somatiske forandringer på RAD52 /12p13.33 i hovedet og Neck pladecellecarcinom (HNSC) og LUSC
Inden somatiske mutationer tilbagekaldt fra parrede normal-tumor exome sekventering prøver af 305 HNSC og 243 LUSC,
RAD52
blev sjældent muterede somatisk (punktmutationer og indsættelser sletninger), med kun 2 HNSC (0,60% af tumorer) og et LUSC (0,40% af tumorer) patienter huser en somatisk missense variant, og ingen somatiske insertion eller deletion observeret.
derimod vi analyseret TCGA somatisk kopi nummer variation (CNV) data på 374 HNSC, 464 LUSC og 476 LUAD tumorer og fandt, at 12p13.33 locus var en hyppig region kopi nummer gevinst i HNSC (7,2% af tilfældene) og LUSC (11,2% af tilfældene ). Kopi nummer gevinst på 12p13.33 blev observeret i en lavere andel af LUAD tumorer (3,9% af tilfældene) (fig. 3). Der var en signifikant forskel i de somatiske kopiantal gain frekvenser mellem SCC og LUAD (p = 3×10
-5). Derudover brugte vi GISTIC2 statistiske program for at bestemme den relative betydning af den 12p13.33 gevinst i forhold til baggrunden på kopi nummer ændringer i hele genomet [27,28] ved hjælp af TCGA somatisk kopi nummer data. Den 12p13.33 region blev identificeret ved GISTIC2 som en betydelig omdrejningspunkt forstærkning i HNSC og LUSC (q-værdi = 0,075 og 0,007 henholdsvis), men ikke i LUAD (figur A i S1 File).
Individer blev bestilt af uovervåget gruppering baseret på
RAD52
ekspressionsniveauerne. Heatmap repræsenterer de skalerede RPKM normaliserede værdier med højere ekspressionsniveauer repræsenteret i røde og lavere ekspressionsniveauer i blåt. De personer, der bærer en kopi nummer gevinst (log
2 (ratio) 0,5) af
RAD52
er markeret med grønt (lys gul ellers).
RAD52
gain luftfartsselskaber synes at have den samme høje udtryk mønster og klynge sammen. Især i LUAD en af de 3 gain luftfartsselskaber har den højeste
RAD52
udtryk niveau.
Tilstedeværelse af somatiske kopi nummer gevinst blev også korreleret med højere
RAD52
udtryk niveauer i både HNSC og LUSC tumorer (p = 6×10
-48 og 3×10
-29 henholdsvis) (fig. 3), med kopi nummer på dette locus tegner sig for en stor del af variansen i
RAD52
tumor udtryk niveauer (57% i HNSC og 45% i LUSC). Som forventet blev genekspressionsniveauer korreleret med kopi nummer til andre gener ved 12p13.33 (11 ud af 26). Men rs10849605 syntes at påvirke kun
RAD52
udtryk niveauer (tabel D i S1 fil).
Diskussion
Vores undersøgelse har identificeret rs10849605 at være forbundet med UADT cancer (p = 6×10
-4). Mens den beskedne karakter af denne forening begrænset vores evne til at opdage inter-substrater heterogenitet, foreningen var relativt ensartet på tværs af de forskellige ætiologiske indstillingerne for Europa, Japan, Latinamerika og sub-kontinentale Asien (hvor tobak tygge er en vigtig UADT kræftrisiko faktor ). Vi bemærker, at forskellige LD mønstre eller kryptiske befolkning struktur, hvor vi var ude af stand til at kontrollere for, kunne påvirke disse resultater. Alligevel vores resultater stemmer overens med den observation, at rs10849605 (eller varianter korreleret med det) er også blevet associeret med lungecancer og især lung pladecellecarcinomer. Som fundet i lungekræft [12], blev allel C i modtagelighed variant rs10849605 forbundet med en beskeden øget risiko for UADT.
rs10849605 er placeret på kromosom 12p13.33, et sted, der indeholder den
RAD52
gen.
RAD52
cellulære rolle er DNA dobbelt streng brud reparation via homolog rekombination, interagere med flere DNA-reparation relaterede gener i denne funktion og derfor en plausibel kandidat gen til at forklare denne sammenhæng [33]. Ikke desto mindre kan vi ikke udelukke muligheden for en alternativ modtagelighed gen til
RAD52
grund koblingsuligevægt. Vi brugte derfor et
i-silico
integrativ analyse ved hjælp TCGA udtryk, genotype og somatiske ombygning data til fine kortlægge denne modtagelighed locus. 12p13.33 var en region af signifikant somatisk kopital gevinst i HNSC og LUSC, hvilket antyder, at somatisk amplifikation af 12p13.33 er en vigtig molekylær begivenhed i en undergruppe af tumorer. Imidlertid 3MBp amplificerede region indeholdt multiple gener foruden
RAD52
. Vigtigere, rs10849605 var en eQTL i HNSC og LUSC for
RAD52
kun, hvilket tyder på
RAD52
som den mest sandsynlige kandidat driver gen for både den genetiske modtagelighed og tumorigenese på dette locus. Som en eQTL, den rs10849605 UADT og LUSC risiko forbundet allel (allel C) blev korreleret med øget
RAD52
ekspressionsniveauerne. At højere
RAD52
ekspression forekommer involveret i både genetisk følsomhed og somatiske begivenheder i UADT og LUSC kan indikere, at RAD52 aktivitet muliggør tumorceller at have tilstrækkelig genom integritet for at undgå apoptose, et træk, der kan være særligt vigtigt i genotoksisk miljø skabt af tobaksrøg og alkoholforbrug. Især blev både eQTL og somatiske gevinster observeret i HNSC og LUSC, men ikke LUAD, i overensstemmelse med lungekræft genetisk modtagelighed [11,12], styrke betydningen af dette locus i SCC.
En vigtig rolle af
RAD52
er at give celler med et niveau af redundans i DNA-reparation [34].
RAD52
er derfor særlig vigtigt i celler, der mangler i BRCA1-PALB2-BRCA2 vej, der giver en alternativ mekanisme til DNA-reparation [35,36]. Målrettet hæmning af
RAD52
i
BRCA2
mangelfulde celler resulterer i genomisk ustabilitet og cellevækst hæmning, der fører til forslaget om
RAD52
som en potentiel terapeutisk target ved hjælp af syntetiske letalitet tilgange [37]. Vores resultater forbinder
RAD52
højere genekspression til UADT og LUSC, sammen med vores seneste observation, at en sjælden beskærer
BRCA2
genetiske variant, rs11571833 (K3326X) er forbundet med en 2,5 gange risiko for pladecellekræft celle carcinomer i lunge og UADT [38,39], tyder på, at sådanne målrettede terapi tilgange kan være værd at undersøge i UADT og LUSC tumorer.
Støtte Information
S1 fil. Metoder A.
figur A, Amplification toppe identificeres på tværs af genomet ved GISTIC2 i HNSC, LUSC og LUAD. De transportcenter-scores vises på toppen og q-værdier på bunden. Betydningen linje tegnes på q-værdi = 0,25 og de væsentligt forstærkede locus er kommenteret på højre side af hvert plot. Den 12p13.33 forstærkede region er indrammet og angivet med en pil. Tabel A, Befolkning lagdeling følsomhedsanalyse. Model 1 er den oprindelige forening analyse logistisk regression, justeret for køn og studere specifikke oprindelsesland. Model 2 justerer yderligere til befolkningen lagdeling herunder de 12 betydende eigen vektorer (som defineret af Tracy-Widom statistik) som kovariater i logistisk regression. Tabel B, eQTL analyser anvendes korrigerede og ikke-korrigerede lineære modeller til at måle effekten af den rs10849605 genotypen på
RAD52
tumor ekspressionsniveauerne. Modellen måler effekten af den beskyttende allel T for rs10849605. Antal personer taget i betragtning i modellen, beta skøn og p-værdi er givet for de tre forskellige typer kræft og ved hjælp af følgende lineære modeller: 1) Ikke-korrigeret, hvordan genotypen påvirker den genekspression. 2) For HNSC kræft, er subtype (mundhulen, strubehoved /hypopharynx eller oropharynx) anvendt som covariat. 3)
RAD52
somatisk kopi nummer anvendes som kovariat. 4) Da vi er interesseret her i indflydelse somatiske determinanter på en stigning på udtryk og fordi methylering er omvendt korreleret med udtryk (hypermethyleret sites tendens til at falde udtryk, når hypomethylated sites inducerer stigning i udtryk), valgte vi otte af de 24 CpG sites for at blive hypomethylated (som defineret af en negativ M-værdi på tværs alle personer i alle vores 3 forskellige kræft sites). Ud af disse otte blev kun cg15612927 signifikant associeret med udtryk for
RAD52
i alle 3 kræftformer (p-værdi 0,05). Derfor tumor methylering niveauer af cg15612927 blev anvendt som covariat. 5) Den oprindelige model er justeret for alle tre somatiske forandringer (undertype til HNSC, somatiske kopi nummer og methylering niveauer). Tabel C, eQTL følsomhedsanalyse. Den lineære model måler effekten af rs10849605 genotype på RAD52 tumor ekspressionsniveauer. Den første linje præsenterer resultater på alle TCGA sager vi adgang. Den anden linje begrænser analysen på TCGA tilfælde forventes at være af europæisk oprindelse. Den sidste linje viser resultaterne af den samme lineære model, men korrigeret for statistisk signifikante eigen vektorer, som defineret af Tracy-Widom (5 for HNSC og LUSC, 8 for LUAD). Tabel D, 12p13.33 kopi nummer versus udtryk og eQTL analyse i HNSC og LUSC. Association analyse mellem kopi nummer og ekspressionsniveauerne for hver given gen i 12p13.33 region (venstre side af bordet, “NA ‘hvis ingen CNV eller udtryk data). For de betydelige foreninger kun udførte vi en eQTL analyse for at kontrollere, hvor rs10849605 genotype påvirker hver given genekspression niveauer (højre side af bordet). Væsentlige resultater er markeret med grønt (Bonferroni korrektion for multiple test)
doi:. 10,1371 /journal.pone.0117639.s001
(DOCX)
S1 Table. Undersøgelse epidemiologiske eksponeringer og genetiske data
doi:. 10,1371 /journal.pone.0117639.s002
(XLSX)
Tak
Forfatterne takker alle deltagere, der deltog i denne forskning og der finansierer og støtte og teknisk personale, som gjorde denne undersøgelse muligt. Vi har også anerkende og takke The Cancer Genome Atlas initiativ, hvis data bidrog stærkt til denne undersøgelse.
Leave a Reply
Du skal være logget ind for at skrive en kommentar.