Abstrakt
Hoved og hals pladecellekræft (HNSCC) er et hyppigt dødelig heterogen sygdom. Ud over den rolle af humant papillomavirus (HPV), der ikke er fastsat valideret molekylær karakterisering af sygdommen. Brug et indbygget genomisk analyse og validering metode vi bekræfter fire molekylære klasser af HNSCC (basal, mesenchymal, atypisk, og klassisk) stemte overens med signatur, der er for squamous lungecarcinom, herunder deregulering af KEAP1 /NFE2L2 oxidativt stress pathway, differential udnyttelse af afstamning markører SOX2 og TP63, og præference for onkogener PIK3CA og EGFR. Til potentiel klinisk anvendelse underskrifterne er gratis for klassificering af HPV-infektion status samt den formodede høj risiko markør CCND1 kopi nummer gevinst. En molekylær ætiologi for undertyper antydes af statistisk signifikante kromosomale gevinster og tab samt differentieret celle oprindelsesland ekspressionsmønstre. Modelsystemer repræsentant for hver af de fire undertyper er også præsenteret
Henvisning:. Walter V, Yin X, Wilkerson MD, CABANSKI CR, Zhao N, Du Y, et al. (2013) Molekylær Undertyper i hoved- og halscancer Exhibit Separate mønstre i Kromosomal Gain og Tab af Canonical Cancer gener. PLoS ONE 8 (2): e56823. doi: 10,1371 /journal.pone.0056823
Redaktør: Muy-Teck Teh, Barts London School of Medicine og Tandpleje, Queen Mary University of London, England
Modtaget: Oktober 1, 2012; Accepteret: 15 januar 2013; Publiceret: 22 feb 2013
Copyright: © 2013 Walter et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering:. Klinisk /translational Award fra UNC Lineberger Comprehensive Cancer center; https://unclineberger.org/research/research/research/developmental-research-awards K12-RR-023.248; https://www.nih.gov. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet
Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser
Introduktion
Hoved og hals pladecellekræft (HNSCC) er en heterogen sygdom, der repræsenterer den syvende mest almindelige form for kræft i USA. Ud over den rolle af humant papillomavirus (HPV), der ikke er fastsat valideret molekylær karakterisering af sygdommen [1] – [4]. For yderligere at karakterisere mangfoldigheden af HNSCC samt andre tumorer, har vores gruppe og andre foreslog genekspression (GE) undertyper som et middel til at prioritere de dominerende genomiske mønstre inden for en bestemt tumor gruppe [5] – [11]. Validerede undertyper baseret primært på GE profilering af brystkræft, glioblastom, lungecancer, og andre har vundet bred interesse [5] – [7], [9] – [11]. Indledende arbejde har antydet, at klinisk relevante undertyper også findes i hoved og halscancer [8], men resultaterne er ikke blevet gentaget, er blevet foreslået nogen modelsystemer, og ætiologien af de undertyper er uklar. I andre tumortyper er blevet etableret valideringen af molekylære signaturer ved følgende fremgangsmåde: (i) de undertyper viste sig at være statistisk gyldige, (ii) genomiske forandringer ligger til grund for undertyper blev dokumenteret, og (iii) modelsystemer repræsentant af udtrykket undertyper blev identificeret. Den aktuelle undersøgelse blev udtænkt for at løse hvert af de ovennævnte punkter. Fordi målet med denne undersøgelse var at opdage genekspression mønstre og underliggende genomiske begivenheder, der er til stede i HNSCC, har undersøgelsens design ikke indarbejde nogen molekylære undertyper, der blev defineret på forhånd – f.eks undertyper klassificeret af HPV-status.
Resultater
Unsupervised Opdagelsen af HNSCC Expression undertyper
For at behandle spørgsmålet om, hvorvidt der kan påvises statistisk signifikante genekspression undertyper i HNSCC, vi udførte hierarkisk klyngedannelse i et uovervåget og saglig måde ved hjælp veletablerede og objektive teknikker [7]. Som i den kendte arbejde af Chung et al. [8], dokumenteret vi tilstedeværelsen af fire genekspression undertyper. Genekspression heatmaps (figur 1A) og grunde produceret af ConsensusClusterPlus [12] (Figur S1 A – C) støtter ikke tilstedeværelsen af yderligere statistisk signifikante klynger i dette datasæt. Et repræsentativt sæt af gener, der er kendt eller mistænkt for at være relevant for hoved- og halskræft er vist i figur 1B, og test statistik for sammenslutning af alle gener i datasættet med tumor undertype findes i tabel S1. SigClust [13] Analysen viste, at p-værdier for alle de parvise sammenligninger af udtrykket undertyper var signifikant på the.05 niveau efter at anvende en Bonferroni korrektion for multiple sammenligninger (Figur S1D). Vi henviser til udtrykket undertyper som basal (BA), mesenkymale (MS), atypisk (AT), og klassisk (CL) baseret på biologiske egenskaber af gener stærkt udtrykt i hver undertype.
Heatmaps af udtrykket værdier af de 840 klassificeringen gener (A) og vælg gener forbundet med HNSCC (B) for hver af de udtryk undertyper. Validation heatmaps af centrum-baserede afstande mellem centroiderne af udtrykket undertyper i den aktuelle undersøgelse og dem fra Chung et al. (C) og de LUSC undertyper af Wilkerson et al. (D).
kliniske karakteristika
De kliniske karakteristika for de patienter, der indgår i den aktuelle undersøgelse repræsenterer et bredt udsnit af patienter med HNSCC der er meget repræsentativ for befolkningen set i en typisk klinisk praksis (tabel 1). Der var ingen korrelation mellem tumor undertype med alder, køn, race, brug af alkohol, pakke år, eller tumor størrelse. Tumor undertyper blev statistisk forbundet med stedet, selv om alle steder havde svulster i hver af udtrykket undertyper, med en enkelt undtagelse (hypopharynx viste ingen BA). Derudover ingen webstedet bidraget med mere end 58% af sine prøver til ét udtryk undertype. Ingen udtryk undertype bestod af mere end 68% af tumorer fra et enkelt sted. I modsætning til andre molekylære markører, såsom HPV eller p16, konkluderer vi derfor, at udtrykket undertyper fanget en dimension af biologi som ikke var begrænset til et enkelt anatomisk site [14]. Der var yderligere statistisk signifikante associationer mellem tumor undertype og HPV-status, behandling, node status, og den samlede scene. Det er bemærkelsesværdigt, at mere BA trended mod at blive godt differentieret, mens 13 af 16 dårligt differentierede tumorer var enten MS eller CL, selvom denne forskel var ikke statistisk signifikant.
Validering af undertyper
Vi vendte derefter vores opmærksomhed på spørgsmålet om, hvorvidt udtrykket undertyper opdaget i den aktuelle datasæt svarede til dem, der tidligere rapporteret af Chung et al. [8]. Wilkerson et al. [7] præsenteret en metode til at sammenligne genekspression mønstre findes i ekspression undertyper tværs af flere studier. Vi bruger den samme fremgangsmåde, som er beskrevet mere detaljeret i afsnittet Metoder. Kort fortalt centroider af udtryk undertyper måler gennemsnitlige genekspression værdier og undertyper med overensstemmende ekspressionsmønstre producere centroider, der er mere stærkt korrelerede end undertyper med disharmoniske ekspressionsmønstre. En klar overensstemmelse blev observeret (figur 1C), med BA, MS, AT, og CL demonstrerer de samme ekspressionsmønstre som Chung undertyper 1, 2, 3, og 4, hhv. Efter at have opdaget fire undertyper bruger uafhængige og upartiske datasæt og metoder, vi anser disse fire udtryk undertyper skal valideres.
Forskellige biologiske processer og ligheder til Lung pladecellecarcinom
De ekspressionsmønstre findes i undertyper antyder tilstedeværelsen af grundlæggende forskelle i den underliggende biologi af de associerede tumorer (tabel S2). Genekspression i BA viste en stærk lighed med signaturen findes i basale celler fra den humane luftvejsepitel, herunder høj ekspression af gener, såsom
COL17A1,
som er forbundet med den ekstracellulære matrix, vækstfaktoren og receptor
TGFa
EGFR
, og transskription faktor
TP63
[14]. Tumorer i MS blev eksemplificeret ved forhøjet ekspression af gener associeret med epitel-til-mesenchymal overgang (EMT), herunder mesenkymale markører
VIM
DES
, transkriptionsfaktoren
TWIST1
, og vækstfaktoren
HGF
[15], [16]. AT tumorer havde en stærk HPV + underskrift, som det fremgår af forhøjet udtryk for
CDKN2A, LIG1
, og transskription faktor
RPA2
[17]. Tumorer i CL, subtype med den tungeste rygevaner, viste høj ekspression af gener, der er forbundet med udsættelse for cigaretrøg, herunder miljøfremmede metabolisme gener
AKR1C1 /3 fotos og
GPX2
[7], [18], [19] og transskription faktor
NFE2L2
[10]
Planocellulært karcinom fra forskellige steder i kroppen har en række molekylære karakteristika -. f.eks tab af kromosom 3p og gevinst på kromosom 3q [20], [21] – så vi hypotese, at en korrespondance mellem vores udtryk undertyper og for nylig rapporteret lunge pladecellekræft (LUSC) udtryk undertyper [7] ville blive observeret. For at undersøge et bredere fænotype af skælcellecarcinomer af overdelen aerodigestive tarmkanalen, vi udvidet centroid prædiktor metode og evaluerede korrespondance af geometriske tyngdepunkter fra LUSC og HNSCC (figur 1D). Bemærkelsesværdigt, blev et klart mønster af korrelation iagttaget ved hvilken BA, MS, og CL undertyper af HNSCC svarede til den LUSC basale, sekretorisk, og klassiske undertyper af henholdsvis Wilkerson et al. [7]. Undersøgelse af TCGA LUSC oplysninger [10], forudsat yderligere overbevisende dokumentation for de underliggende forbindelser mellem udtrykket undertyper ved de to tumor sites (figur S2). Korrespondancen mellem de basale undertyper er bemærkelsesværdig, fordi Wilkerson et al. [7] beskrevet tidsforløbet forsøg med dyrkede humane bronchiale epitelceller, hvor genekspression mønstre på tidlige tidspunkter viste en stærk lighed med dem, der ses i den basale undertype af LUSC. Ligeledes som vist i tabel S3, observerede vi, at den basale undertype af HNSCC ligner mest dagen 3 tidspunkt i tidsforløbet data fra luften væske-grænsefladen (ALI) model [22].
DNA Kopier Analyse af Subtype
Vi vendte derefter opmærksomheden mod de genomiske ændringer af HNSCC målt ved kopi nummer (KN) arrays. Først bekræftede vi mange regioner tidligere er rapporteret som ændret i HNSCC, herunder gevinst på kromosomer 3q, 7p, og 11q (statistisk signifikante gevinster ses i både 11q13 og 11q22) og tab af kromosomer 3P 9P og 14q (tabel S4). Som det er set i andre tumorer [11], er der både samstemmende og disharmoniske mønstre af kopi nummer ændringer i centrale områder af genomet som en funktion af tumor undertype (figur 2, tabel S5). For eksempel, gevinster på 3q varierer ved ekspression undertype (p = 0,01), hvorimod der ikke blev påvist nogen signifikante KN forskelle mellem de undertyper i 11q13, som indeholder
CCND1
(p = 1). Den kanoniske HNSCC 7p gevinst indtraf i en region, der indeholder
EGFR
, men disse ændringer blev fundet i BA, MS, og CL, ikke AT (p = 0,01). KN værdier i 3p var ikke signifikant forskellige på tværs af undertyper (p = .47). Tab af den 9p region, der indeholder
CDKN2A
blev fundet i BA og kun CL, og KN forskelle var signifikante (p = 0,01). Focal KN tab blev fundet i 14q32 for MS, CL, og er særlig udtalt i AT, men selv om dette ikke ikke statistisk signifikans. Denne region indeholder miR203, der er bemærkelsesværdig, fordi den henvender ΔNp63 [23], en af seks proteinprodukter af
TP63
. Kromosomal ustabilitet også varieres betydeligt ved subtype (p = 2.2E-4), som vist i fig S3.
Plots af gennemsnitsværdierne kopi talværdier i HNSCC udtrykket undertyper efter udjævning og outlier fjernelse, både genom-dækkende (A) og for specifikke kromosomer eller regioner af interesse (B).
Kopier nummer Ændringer og Differential ekspression af gener i kromosom 3q ved Expression Undertype
En af de kvintessensen genomiske forandringer forbundet med planocellulært karcinom er gevinst på 3q [20], [21], og i det foregående afsnit, vi bemærkede, at KN værdier i denne region varieres ved udtryk undertype. Interessant, der var en særskilt differentieret proportional anvendelse af de tre gener typisk diskuteres, målene i amplikon:
TP63, PIK3CA
og
SOX2 Hotel (figur 3). CL og AT undertyper demonstreret forholdsmæssigt højere udtryk for
SOX2
forhold til MS og BA, som faktisk viste sig at udtrykke mindre
SOX2
end normale tonsil kontroller. Derimod BA undertype udtrykte dramatisk højere niveauer af
TP63
end nogen anden gruppe. Ligeledes selvom MS subtype udviste kopital gevinster i 3q, ingen af de formodede target gener syntes at blive udtrykt på niveauer højere end normalt tonsil. Kruskal-Wallis test viste, at ekspressionen af hver af
TP63, PIK3CA
og
SOX2
var forbundet med udtryk undertype efter en Bonferroni korrektion for multiple test (tabel S6). Denne iagttagelse rejser den mulighed, at heterogenitet HNSCC kan delvist forklares ved forskellen brug af transkriptionsfaktorer (
SOX2
TP63
) og onkogen (
PIK3CA
) i 3q amplicon, som er mere kompleks end tidligere er blevet beskrevet [24]. Det tyder også på, at forskellen brug af transkriptionsfaktorer og onkogener, fremmes delvist af distinkte kopi nummer ændringer kan bidrage til genekspression signaturer, der definerer udtrykket undertyper.
Mean gen-specifikke kopi nummer og genekspression værdier i HNSCC udtryk undertyper og normale tonsil prøver (NL) for gener i 3q amplicon.
Kopier Antal arrangementer med deltagelse Canonical Cancer gener
Tidligere vi bemærkede, at kopi talværdier i gevinst og tab regioner var forbundet med udtryk undertype. Nu beskriver vi lignende resultater, der blev opnået, når gen-specifikke kopi talværdier for gener er kendt for at spille en rolle i HNSCC –
CCND1, CDKN2A
og
EGFR
– blev anset, ikke den bredere regioner beskrevet ovenfor. I ovenstående diskussion erklærede vi, at gevinster på 11q13 ikke var signifikant forskellige på tværs af undertyper, og tabel 2 viser, at blev fundet lignende resultater, når opmærksomhed blev begrænset til gevinster på
CCND1
. I modsætning hertil var frekvensen af
EGFR
gevinster varierede fra 0% i AT til 31% i CL (p = 0,069), mens hyppigheden af
CDKN2A
tab varierede mellem 10% i MS til 63% i CL (p = .004). Begge disse resultater er overensstemmende med resultaterne i de bredere områder af 7 p og 9p henholdsvis beskrevet ovenfor.
Tidligere undersøgelser har påvist associationer mellem forskellige genomiske begivenheder og disse resultater givet indsigt i enten underliggende biologi eller den kliniske behandling af kræftpatienter [25], [26]. I HNSCC, samtidige
CCND1
gevinster og
CDKN2A
tab er blevet undersøgt af Okami et al. [27] og Namazie et al. [28], med Namazie et al. påvisning af en association mellem disse genomiske begivenheder. Vi fandt, at
CCND1
KN gevinster var forbundet med
CDNK2A
tab på tværs af alle undertyper (tabel S7), og at den fælles arrangement var forbundet med udtrykket undertyper (tabel 2), hvilket bekræfter og at udvide resultaterne af Namazie et al.
kliniske resultater med Expression Undertype og focal genomiske Ændringer
efter at have parset sættet af næsten 140 HNSCC tumorer i udtryk undertyper, og i lyset af kendte risikofaktorer sådanne som HPV, rygning og brug af alkohol, vi overvejet, om yderligere lagdeling for patientresultater kunne foreslået. Vi først undersøgt, om overlevelsesfordel rapporteret af Chung et al. for “undertype 1” kunne gengives i den aktuelle kohorte. Vi kunne ikke bekræfte dette resultat, og i den aktuelle undersøgelse var der ingen sammenhæng mellem gentagelse overlevelse og tumor undertype, enten samlet (figur 4A), eller når vi begrænser til patienter sene stadie (ikke vist). Disse forskelle kan forklares ved den kliniske heterogenitet af sygdommen kombineret med det faktum, at tumor websted fordelinger i de to undersøgelser er markant anderledes.
Kaplan-Meier plots og Log-Rank Test p-værdier, der sammenligner gentagelse-fri overlevelsestider i alle ekspressionssystemer undertyper (A), HPV + vs. HPV emner (B), alle ekspressionssystemer undertyper i HPV emner (C), og AT kontra ikke-AT i HPV forsøgspersoner (D). Statistisk signifikans blev vurderet ved hjælp af log rank test.
For at afklare, om kendte eller mistænkte confoundere kan have påvirket vores evne til at opdage undertype-specifikke forskelle i patient resultat, vi evaluerede effekten af HPV-status på den samlede overlevelse. Vi observerede en relativt stor, men upræcist virkning på grund af det samlede lille antal HPV + patienter (figur 4B). Vi fandt det derfor rimeligt at revurdere kohorten med HPV + patienter udelukket. Udelukkelse af HPV + patienter viste, at AT undergruppe demonstreret en særlig ugunstig resultat (figur 4C), og denne forskel var statistisk signifikant sammenlignet med alle andre undertyper tilsammen (figur 4D). Vi tilgås derefter et uafhængigt sæt 122 væv microarray (TMA) prøver i et forsøg på at validere denne konstatering. Fordi array-baserede GE og immunhistokemi (IHC) farvning værdier ikke er sammenlignelige, var det ikke muligt at forudsige tumor undertype af hver TMA prøve. I stedet brugte vi lave EGFR og høj p16 farvning som en proxy for AT-status. Forskellen i overlevelsestid var ikke statistisk signifikant, men vi opnåede resultater svarende til dem, der er beskrevet ovenfor (figur S4).
Vi undersøgte også, om eventuelle fokale kopi nummer begivenheder var forbundet med kliniske resultat. Tidligere undersøgelser har påvist en sammenhæng mellem CCND1 gevinster og faldt gentagelse-fri overlevelse gange i HNSCC [29]. Vi opnåede lignende fund, da vi undersøgte KN-værdier for alle tumorprøver (figur S5), selv om vores resultater er marginalt signifikant (p = 0,07). Bemærkelsesværdigt få AT emner udstillet
CCND1
gevinster (tabel 2), og dette tyder tilstedeværelsen af to stort set adskilte grupper af patienter med dårlige kliniske resultater: dem med
CCND1
gevinster og dem, der er HPV – og AT. Figur S6 understøtter denne konklusion.
Expression Undertyper i Model Systems
Cancer cellelinje Encyclopedia [30] indeholder genomiske data fra over 900 menneskelige kræftceller, herunder både GE og KN data fra 19 esophageal og 18 øvre aerodigestive tract cellelinier. Vi anvendte vores tyngdepunkt prædiktor til GE data fra disse cellelinier og fandt, at alle fire udtrykket undertyper var til stede (tabel S8). Disse resultater er særligt overbevisende i lyset af den kliniske relevans af udtrykket undertyper, fordi de giver grundlag for fremtidige undersøgelser med modelsystemer. Figur S7 giver eksempler til at illustrere, at undertype-specifikke KN begivenheder ses også i de cellelinjer
Diskussion
Vores primære resultat var påvisningen af fire genekspression undertyper i HNSCC -. Basale, mesenkymale , atypisk, og klassisk. Vi viste også, at disse undertyper har biologisk og klinisk relevans, og derfor giver de en nyttig og informativ mekanisme klassificere HNSCC tumorer, der supplerer de eksisterende metoder baseret på histologi og tumor. Analyse af offentligt tilgængelige udtryk datasæt afslørede, at disse undertyper er reproducerbare i HNSCC [8] og er bemærkelsesværdigt lig dem, der findes i LUSC [7], [10]. Selvom genekspression mønstre for den sekretoriske LUSC undertype ligner dem, der ses i mesenkymale undertype af HNSCC, vi foretrækker en alternativ nomenklatur. Data, der bekræfter glandulær oprindelse HNSCC er mindre overbevisende i forhold til, at der for lungerne, og tegn på en mesenkymale signatur er rigeligt [7]. Selv om det ville være muligt at anvende de eksisterende data til at producere et gen prædiktor for HPV-status, vi ikke forsøge at gøre dette, fordi resultaterne af denne art blev præsenteret af Martinez et al. [31]. blev påvist regioner af tilbagevendende DNA kopital gevinst og tab, hvoraf nogle indeholder kendte onkogener og tumor suppressorer. Kopitallet værdier i visse afvigende områder var forbundet med tumor undertype, hvilket antyder, at kopital begivenheder kan bidrage til udvikling af ekspressionssystemer undertyper. Alle de udtryk undertyper blev påvist i HNSCC cellelinjer, en konstatering, der danner grundlag for fremtidige undersøgelser.
Vi har nu kort diskutere definitionerne af udtrykket undertyper. Basal og klassisk blev valgt, fordi udtrykket mønstre i disse undertyper viste stærke ligheder med de basale og klassiske undertyper af LUSC. Wilkerson et al. sammenlignet ekspressionsmønstrene i LUSC undertyper til tidsforløbet data i at udvikle humane bronkiale epitelceller, og de fandt, at den basale subtype havde lignende ekspressionsmønstre, som ses efter tidlige tidspunkter når basale celler er mest almindelige. Ligeledes som vist i tabel S2, observerede vi, at den basale undertype af HNSCC ligner mest dagen 3 tidspunkt i tidsforløbet data fra ALI model [22]. Den klassiske subtype udviser kanoniske genomiske ændringer associeret med pladecellecarcinom – fx sletning af 3p og 9p, forstærkning af 3. kvartal, og fokal forstærkning af både
EGFR
CCND1
. Mesenchymal blev valgt baseret på pathway analyse indikerer en epitelial til mesenkymale overgang. Endelig atypisk blev valgt på grund af den manglende enten
EGFR
forstærkning eller sletning af 9 p.
Forskellene i ekspressionsmønstre findes i undertyper er klinisk relevant.
TP63
producerer seks forskellige proteiner, og ΔNp63 er den mest rigelige isoform i HNSCC [32]. Yang et al. [33] viser, at ΔNp63 fremmer celledeling. Chatterjee et al. [32] bemærkede, at udsættelse for cisplatin førte til nedsatte niveauer af ΔNp63, så denne behandling kan være særligt effektive for patienter i BA. Barbieri et al. [34] viste, at tab af
TP63
i HNSCC cellelinjer førte til erhvervelsen af en mesenkymale fænotype, der er overbevisende i lyset af de lave ekspressionsniveauer af
TP63
set i MS. Martin og Cano [35] viste, at forhøjet udtryk for
TWIST1
eller
BMI1
i HNSCC cellelinjer kan øge sandsynligheden er invasiv og migration. Fordi MS tumorer udviste en EMT fænotype og øget ekspression af både
TWIST1
og
BMI1
kan disse emner være mere tilbøjelige til at udvikle fjernmetastaser. Det faktum, at
EGFR
overudtrykkes i hovedparten af HNSCC tumorer [36] gør
EGFR
inhibitorer en attraktiv behandlingsmulighed for denne sygdom. Men disse behandlinger er mindre tilbøjelige til at være effektive i AT tumorer fordi
EGFR
ekspression var lavere end i de andre ekspressionssystemer undertyper.
SOX2
ALDH1
blev stærkt udtrykt i AT og CL, og begge af disse gener er formodede kræft stamceller markører på grund af deres bidrag til selv-fornyelse og en pleuripotent fænotype [37], [38]. Protein produkt af
PIK3CA
er p110α, der phosphorylerer AKT. Aktiveret AKT bidrager til overlevelsen af tumorceller og dermed oncogen transformation [39]. West et al. [40] viste, at udsætte normale lungeepitelceller nikotin letter aktivering af AKT ved at gøre den afhængig af PI3K alene. Denne observation kombineret med de høje niveauer af rygning ses i CL, tyder på, at PI3 kinase hæmmere giver en attraktiv behandlingsmulighed for CL tumorer.
Der var flere begrænsninger for denne undersøgelse. Først havde vi ikke GE, CN, og kliniske data for alle forsøgspersoner, hvilket begrænsede vores evne til i fællesskab at analysere disse variabler. Endvidere selvom subtype etiketter blev objektivt defineret af en klyngedannelse algoritme og genekspressionsmønstre blev uafhængigt valideret, de kliniske sammenslutninger var ikke. Kopier nummer arrays blev genereret for alle prøver med tilstrækkelig kvalitet og mængde af DNA. Desværre, over 20% af de arrays undladt at opfylde standardiserede kvalitet målinger. Også, det ikke var klart, hvilke isoform (r) af
TP63
blev analyseret af vores genekspression arrays, og desværre den rolle, som
TP63
spiller i den basale subtype ikke kan fuldt værdsat uden viden af disse isoformer. Fordi HPV + prøver blev fjernet, når de foretager vores sekundære overlevelsesanalyse, bør disse resultater ses som sonderende og derfor skal uafhængigt valideret. Endelig HPV status for alle patienter var ikke tilgængelig.
Som konklusion bekræftede vi fire molekylære klasser af HNSCC (basal, mesenchymal, atypisk, og klassisk), i overensstemmelse med signatur, der er for squamous lungecarcinom. Ved hjælp af en integreret genomisk analyse og validering metode, vi dokumenterede undertyper identificeret ved kanoniske tumorsuppressorgener og onkogener, herunder liberalisering af
KEAP1 /NFE2L2
oxidativ stress vej, differential udnyttelse af afstamning markører
SOX2
og
TP63
, og præference for onkogener
PIK3CA
EGFR
. Til potentiel klinisk anvendelse, signaturerne er gratis for klassificering af HPV-infektion status samt den formodede høj risiko markør
CCND1
kopi nummer gevinst. En molekylær ætiologi for undertyper antydes af statistisk signifikante kromosomale gevinster og tab samt differentieret celle oprindelsesland ekspressionsmønstre. Model systemer repræsentant for hver af de fire undertyper blev også præsenteret.
Materialer og metoder
Tumor Indsamling og Genetic Analyser
Efter at have modtaget skriftligt informeret samtykke, frosne, kirurgisk udvindes, macrodissected hoved og hals tumorer blev indsamlet på University of North Carolina under Institutional Review Board-protokol # 01-1283. Tumor RNA blev ekstraheret og mRNA-ekspression blev analyseret under anvendelse Agilent 44k mikroarrays. Tumor-DNA blev ekstraheret og DNA kopital blev analyseret under anvendelse Affymetrix GenomeWide SNP 6,0 chips. En oversigt over alle genetiske data, der anvendes i denne undersøgelse kan findes i tabel S9.
mRNA Expression Analysis
kontrolprocedurer Kvalitet blev anvendt til microarray sonde niveau intensitet filer. I alt 138 tumor arrays tilbage efter fjernelse af lav kvalitet arrays, dublerede arrays, og arrays fra ikke-HNSCC prøver. Korrektionen normexp baggrund og løss normalisering procedurer [41] blev anvendt på de data, sonde-niveau. Efter log
2 transformation blev sonder matches til en fælles gen-database til at producere udtryk værdier for 15597 gener.
Unsupervised Expression Undertype Discovery
Den her beskrevne fremgangsmåde svarer til den, der dukkede i Wilkerson et al. [7]. Efter ekspression værdier var gen median centreret, blev genet variabilitet beregnes ved hjælp medianen absolution afvigelse. De 2500 mest variable gener blev udvalgt. ConsensusClusterPlus [12] blev anvendt til at udføre ukontrollerede klyngedannelse for disse gener i de 138 arrays. Denne procedure blev udført med 1000 tilfældigt udvalgte sæt microarray prøver under anvendelse af en prøveudtagning andel på 80% og en afstand metrisk lig med en minus Pearson korrelationskoefficienten.
statistiske signifikans af genekspressionsmønstre i ekspression Undertyper
for at bekræfte den statistiske signifikans af fire klynger, SigClust [13] blev anvendt ved hjælp af sæt af de 2500 mest variable gener er beskrevet ovenfor. Alle parvise sammenligninger af de undertyper blev undersøgt ved hjælp af 1000 simulerede prøver og den oprindelige kovarians beregningsmetode.
differentielt udtrykte gener og Metabolic Pathways
differentielt udtrykte gener blev påvist med R pakken SAMR [42] anvendelse af en median FDR tærskel of.01. For hver af de UNC undertyper vi sammenlignet genekspressionen værdier i undertype til alle andre undertyper tilsammen. DAVID [43] blev derefter anvendt til at finde Kegg pathways, der viste berigelse for højt udtrykte gener i hver undertype. Desuden differentielt udtrykte gener med kendte funktionelle kategorier, f.eks transkriptionsfaktorer, blev fundet ved at sammenligne undertype-specifikke gen lister til kendte gen ontologi kategorier [44].
Udgivet Expression data
De microarray sonde niveau intensitet filer produceret af Chung et al. [8] blev underkastet baggrund korrektion, normalisering, og sammendrag procedurer gen-niveau svarende til de ovenfor beskrevne. Dette frembragte genekspression værdier for 60 forsøgspersoner og 8224 gener. Subtype etiketter til disse 60 arrays, der dukkede op i [8] betegnes som Chung undertyper 1, 2, 3 og 4.
Resumé RPKM værdier for 20,502 gener og 178 forsøgspersoner blev opnået på grundlag af RNASeq data præsenteret i [10]. De RPKM værdier var log
2 forvandlet, og enhver gen, der indeholdt mindst en manglende værdi blev fjernet fra analysen. Denne produceret genekspression værdi for 15,314 gener.
Validering af Expression undertyper
Konsensus klyngedannelse tildeler en undertype etiket på hver array. Som et resultat heraf kan nogle arrays ikke repræsentative for deres subtype. Brug silhuet bredder [45], identificerede vi et sæt 125 “kerne” prøver, hvis udtryk mønstre var mere ligner dem af medlemmer af deres egen undertype end andre undertyper. ClaNC [46], en klassificering metode baseret på nærmeste geometriske tyngdepunkter, blev derefter påført på den UNC udtryk data fra kerneprøver i et forsøg på at skabe et sæt af klassificeringen gener, hvis ekspression signatur kan anvendes til at klassificere nye prøver. Minimering af cross-validering fejlprocenten produceret en liste over 840 klassificeringen gener (210 gener pr undertype).
Vi identificerede klassificeringen gener, hvis udtryk værdier er også til stede i Chung udtryk datasæt, og derefter begrænset UNC og Chung udtryk datasæt til disse gener. Efter gen median centrering hver datasæt separat, fandt vi det geometriske tyngdepunkt for hver af UNC og Chung undertyper ved at beregne medianen udtryk værdi for hvert gen i alle arrays af passende subtype etiket. Som i [7], blev afstandene mellem UNC og Chung centroids beregnet ved hjælp af en afstand metrisk lig med en minus Pearson korrelationskoefficienten. Denne valideringsprocessen blev gentaget ved hjælp af de LUSC data fra Wilkerson et al. [7]. De RNASeq data fra [10] blev håndteret på samme måde med følgende forskelle: (i) genekspression værdier fra UNC og log
2 (RPKM) værdier fra TCGA datasæt blev hver median centreret og standardiseret af genet, (ii)
Leave a Reply
Du skal være logget ind for at skrive en kommentar.