Abstrakt
Baggrund
Kolorektal cancer (CRC) er med cirka 1 million tilfælde den tredje mest almindelige kræft på verdensplan. Omfattende forskning er i gang for at dechifrere de underliggende genetiske mønstre med håb om at forbedre tidlig kræft diagnose og behandling. I denne retning, har de seneste fremskridt i næste generations sekventering teknologi revolutioneret området for kræft genomforskning. Men en advarsel af disse undersøgelser er fortsat den store mængde af genetiske variationer identificeret og deres fortolkning.
Metodologi /vigtigste resultater
Her præsenterer vi det første værk på hele exome NGS af primære coloncancerformer. Vi udførte 454 hele exome pyrosekventering af tumor samt tilstødende ikke påvirket normale colon væv fra mikrosatellit stabil (MSS) og mikrosatellit ustabile (MSI) kolon kræftpatienter og identificeret mere end 50.000 små nukleotid variationer for hvert væv. Ifølge forudsigelser baseret på MSS og MSI patomekanismer identificerede vi otte gange mere somatiske ikke-synonyme variationer i MSI kræftformer end i MSS, og vi var i stand til at reproducere resultatet i yderligere fire CRCs. Vores bioinformatik filtrering tilgang indsnævret antallet af de fleste væsentlige mutationer til 359 til MSI og 45 til MSS CRC’er med forudsagte ændrede protein funktioner. I begge CRCs, MSI og MSS, fandt vi somatiske mutationer i det intracellulære kinasedomæne af knoglemorfogenetisk protein receptor 1A, BMPR1A, et gen, hvor hidtil kimcellelinje mutationer er associeret med juvenil polypose syndrom, og viser, at mutationerne funktionelt forringe proteinfunktion .
konklusioner /betydning
Vi konkluderer, at en med dyb sekventering af tumor exomes kan være i stand til at forudsige mikrosatellit status CRC og derudover identificere potentielt klinisk relevante mutationer.
Henvisning: Timmermann B, Kerick M, Roehr C, Fischer A, Isau M, Boerno ST et al. (2010) Somatisk Mutation Profiler af MSI og MSS Kolorektal Cancer Identificeret af Whole Exome Next Generation Sequencing og Bioinformatik Analysis. PLoS ONE 5 (12): e15661. doi: 10,1371 /journal.pone.0015661
Redaktør: Amanda Ewart Toland, Ohio State University Medical Center, USA
Modtaget: August 25, 2010; Accepteret: November 19, 2010; Udgivet: 22 December, 2010
Copyright: © 2010 Timmermann et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering:. Dette arbejde blev støttet af den tyske Forbundsministeriet for Uddannelse og Forskning (01GS08105 “Mutanom,” 01GS08111 “Intestinal Modifers”) og Max Planck Society. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet
Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser
Introduktion
Tyktarmskræft er den tredje mest almindelige kræftform med omkring 1 million tilfælde på verdensplan. I de sidste årtier er det blevet klart, at CRC udvikler sig gennem flere veje, og at disse veje kan groft defineres på grundlag af molekylære mønstre såsom integritet fejlparringsreparationssystemet (MMR) eller mutationsmønstre og epigenetiske mønstre. Mangel i MMR afspejles i DNA-mikrosatellit instabilitet (MSI) som også er blevet forbundet med behandlingsresultatet, men som skal yderligere valideret i yderligere kliniske undersøgelser [1], [2], [3], [4], [ ,,,0],5], [6].
High-throughput Sanger sekventering undersøgelser på den anden side har vist, at mutationen hyppigheden af kandidat cancer-gener kan være meget højere end forventet, og at den særlige kombination af mutationer kunne have indflydelse på tumor egenskaber [7], [8], [9], [10], [11]. Med udviklingen af næste generation sekventering (NGS) teknologier for sekventering gennemløb steget dramatisk, og omkostningerne er faldet. Desuden og især vigtigt for kliniske rammer, NGS kan anvendes på formalinfikseret og paraffinindlejret FFPE vævsmateriale samt yderst nedbrudt DNA, som rutinemæssigt fremstilles i patologiske afdelinger eller findes i gammelt dna [12], [13]. Adskillige undersøgelser har anvendt NGS teknologier til identifikation af den underliggende mutation i monogenetiske sygdomme [14], [15]. Det er dog kun et begrænset antal undersøgelser rapporterer om næste generation sekventering for at identificere nye kandidat cancer gener; en af de tidligste undersøgelser undersøgte cytogenetisk normal akut myeloid leukæmi, og brystkræft genomer [16], [17]. Desuden har undersøgelser af malignt melanom og småcellet lungecancer cellelinier forudsat første indsigt i genomiske ændringer induceret af ultraviolet lys eksponering eller tobaksrøg [18], [19].
For at få indblik i de genomer af mikrosatellit stabile og ustabile kolorektal kræft og identificere funktionelle relevante mutationsmønstre vi brugte en hybridisering baseret hel exome DNA opfange indflyvning efterfulgt af 454 næste generation sekventering [20]. Anvendelse strenge bioinformatik analyser, vi indsnævret ned på mængden af funktionelt betydelige somatiske mutationer i MSI til 359 og 45 i MSS kræftformer, hvilket understreger specifikke mutation mønstre afhængigt af mikrosatellit status. Vi var i stand til at bekræfte vores resultater ved sekventering af exomes af fire yderligere CRC sager (en MSI, tre MSS) ved hjælp af en anden berigelse og sekventering teknologi. Blandt disse mutationer er BRAF i MSI kræft og KRAS og TP53 i MSS cancer, yderligere understreger gyldigheden af vores udvalg tilgang [21]. Yderligere funktionelle karakteriseringer identificeret tilbagevendende somatiske mutationer i BMPR1A, et protein, der hidtil har været forbundet med unge polypose syndrom, en kræft disposition syndrom.
Resultater
Sekvens-specifik berigelse og sekventering strategi
Vi sekventeret tumor og matchende normale colon væv fra to patienter med høj kvalitet adenocarcinom i colon (G3), patient 1 med en mikrosatellit ustabile og patient 2 med en mikrosatellit stabil tumor (tabel 1, figur S1). Til bestemmelse af kimcellelinje mutationer vi sekventeret ud over de tumorvæv fra hver patient hosliggende ikke påvirket normale colonvæv. Brug Illumina sekventering og SNP arrays vi konstateret, at tumor patient 1 er kopiantals stabil hvorimod patient 2 viste variationer, som vi brugte til revurdering af identificerede højstringente mutationer (tabel S3).
vi analyserede de fuldstændige exomes på mere end 135.000 exoner med enkelt-read haglgevær 454 sekventering (figur 1, figur S1, figur S2, tabel 2). For at vurdere effekten af dækningen dybde af følsomheden og specificiteten af sekvensvariant afsløring, genotype opkald af Affymetrix SNP-array 6.0 blev sammenlignet trinvis til den kaldte nucleinsyre positioner og resulterede i en nøjagtighed på mere end 99% (figur S3) . Ud over den SNP-array, vi bruges Sanger-sekventering for at bekræfte 23 udvalgte mutationer (tabel S5, fig S5).
(A) Venn-diagram af tilfangetagne exoner af normale og tumorprøver. Captured exoner med mindst én læsning blev talt. (B) Repræsentant normaliseret dækning-fordeling plot. Fraktionen af lokkemad-dækket exoner i genomet opnå dækningsområder lig med eller mindre end den normaliserede dækning er angivet på x-aksen. Den gennemsnitlige dækning pr exon blev delt med den gennemsnitlige dækning af alle exons.
Identifikation af somatiske mutationer i kodningssekvenser for et MSI CRC
Søgning efter varianter i kodende regioner vi fandt 12,767 og 12,518 små nukleare variationer i 6.428 og 6.205 gener, for tumor og normal hhv. Af disse varianter 1.428 til kontrol og 2,404 for tumor har en gennemsnitlig heterozygositet eller mindre allel frekvens på under 1% eller ikke tidligere blevet rapporteret i dbSNP eller 1000 genomer Project (figur 2). Da indels (små indsættelser og sletninger) på homopolymere websteder er en vigtig kilde til sekventering fejl i 454-platformen vi ignoreret denne type ændring i vores analyser.
(A) Skematisk af bioinformatik SNV afsløring workflow. (B) Udvinding af funktionelt relevante somatiske mutationer til MSI og MSS kolorektal kræft. Varianter blev påvist med GS reference Mapper, før de blev filtreret for deres lokalisering, annotation i dbSNP130 eller 1000genomes, somatisk og funktionelt værdiforringelse. Fra dbSNP130 eller 1000genomes varianter med blev brugt frekvenser over 1%. For MSI CRC 359 varianter og MSS CRC 45 med forudsagte ændrede protein funktioner blev identificeret.
Vores somatiske variant afsløring strategi er designet til at minimere falsk positive somatiske variant opkald i stedet for at bestemme zygositet. Vi brugte en to-trins tilgang med to forskellige stringensniveauer at opdage varianter i tumor og godartede væv ligner Pleasance
et al.
[18]. I det første trin blev tumor varianter kaldt under stringente kriterier, som blev bestemt ved sammenligning med SNP genotyping array-data. Det andet trin undersøges, om svulsten varianten var germlinie eller somatisk. For at holde den falske negative kurs i godartet væv på mindre end 10%, satte vi dækningen cut-off på 5-fold, under hvilken der ikke konklusioner blev draget med hensyn til, om en variant var somatisk eller kimcellelinje. Hvis dækningen cut-off blev opfyldt, en enkelt læser, som viser den samme variant i benigne og tumorvæv resulterede i kategoriseringen af varianten som germlinie.
Brug denne strategi, vi identificeret 915 somatiske ikke-synonyme mutationer påvirker 864 gener. Størstedelen af somatiske mutationer var missense mutationer (65%). Men mange (7%) er placeret inden utranslaterede regioner af gener og kan derfor resultere i ændret ekspression eller øget henfald af mRNA-arter. Endvidere er ca. 0,5% af disse mutationer findes på splejsningssteder og kunne påvirke splejsningsbegivenheder, hvilket fører til en ændret transkriptom struktur. Endvidere blev tre somatiske varianter identificeret i miRNA regioner (Tabel S6). Disse mutationer er af særlig interesse, fordi miRNA er blevet impliceret som master-regulatorer af tumor homeostase. Analyse af de specifikke typer af nukleinsyre-variationer, herunder kendte og ukendte varianter, viste væsentlige de forventede satser for udvekslinger nukleotid, som bestemt af beregninger med dbSNP130 (figur S4).
Funktionel analyse af mutationer for en MSI kolon kræft
Da ikke alle de 1.304 somatiske mutationer vil sandsynligvis være patologisk relevant, søgte vi at identificere dem, der sandsynligvis ødelægge protein funktion eller påvirker højt konserveret aminosyrer og kan derfor være funktionelt vigtigt. Vi anvendte Polyphen og MutationTaster klassifikation værktøjer til at forudsige de funktionelle konsekvenser af aminosyreændringer eller læserammeforskydningsmutationer og fandt, at 359 gener havde mindst én potentielt ødelæggende mutation (tabel S1) [22], [23].
de potentielt destruktive somatiske mutationer, 309 var placeret i stillinger højt konserverede i 44 forskellige arter, herunder opossum
(Monodelphis domestica)
, kylling
(Gallus gallus)
lampret
(Petromyzon marinus )
. Af disse 259 var placeret i gener udtrykt i colon, hvoraf 47 var reparation, receptor, eller kinase gener. Visualisering af udvalgte mutationer på proteinstrukturer indikerer, at disse nukleotider er på proteinet overfladen, hvilket kan medføre forstyrret protein-protein interaktioner.
Katalog af somatiske mutationer i Cancer (COSMIC) database er en omfattende samling af kræft- relaterede mutationer. Ca. 39% af vores muterede gener blev allerede beskrevet i denne database, og 13% blev fundet af Wood
et al
[10]. Som gjorde disse tidligere databaser, fandt vi
BRAF
p.V600E mutation i MSI sagen, og vi identificerede
KRAS
og
TP53
mutationer i MSS tumor.
BRAF
mutationer findes i ca. 10% af CRC’er, overvejende MSI og 30 til 35% af alle patienter med sporadiske kolorektal kræft bære somatiske
KRAS
og
TP53
mutationer. Disse resultater viser yderligere følsomheden af vores klassificering strategi.
Mutationsanalyse landskab af en MSS tyktarmskræft
For MSS tyktarmskræft vi identificeret 10,622 små nukleare variationer. Efter de samme filtrering processer som for MSI kræft ved hjælp af dbSNP databasen og data fra 1000 genomer Project 1.288 varianter forblev som enten havde lav prævalens eller var ukendte. Af disse 198 var somatiske og 45 blev forudsagt til at ændre genfunktion baseret på MutationTaster og Polyphen beregninger (figur 2B, Tabel S2) [22], [23]. Med hensyn til kopital variationer fem af de 45 identificerede mutationer er placeret inden amplificerede regioner, og, som forventet, ingen i regioner med deletioner. Forholdene af læser med henvisning sekvens til muteret sekvens højst nøgletal i kopi nummer stabile områder, som understøtter SNV-ringer algoritme.
I modsætning til 1.304 somatiske mutationer i MSI tumor fandt vi 198 somatiske mutationer i MSS tumor, som viser, at det defekte MMR-systemet i MSI tumorer resulterer i en betydelig stigning i mutationsrater i kolorektal cancer.
Desuden ser på kryds mellem de to kræftformer vi fundet BMPR1A, WDTC1 (WD og tetratricopeptode gentager 1 ) og EHD3 (EH-domæne indeholdende 3) muteret i begge tumorer. Udvælgelsen var baseret på funktionsnedsættelse med stor sandsynlighed i Polyphen og MutationTaster [22], [23]. Alle mutationer er placeret på overfladen af proteinet og er stærkt konserverede. Da vi fandt signifikante kræftrelaterede pathways associeret kun med BMPR1A men ikke med WDTC1 eller EHD3, og derudover germlinie mutationer i BMPR1A er en kendt risikofaktor for juvenil polypose syndrom, valgte vi BMPR1A for yderligere funktionelle assays (figur 3, figur S5) . Brug reporter assays med vildtype og muterede BMPR1A proteiner kunne vi vise, at de muterede proteiner er stærkt svækket i deres signalering funktion og at stimulering med BMP-2 resulterer i en reduceret maksimal aktivitet (figur 3D).
(A ) Proportional Venn-diagram. Fraktioner af kaldte SNVs identisk med den genomer Projektdata og dbSNP130. Kun data, for hvilke den mindre allel frekvens eller den gennemsnitlige heterozygositet var kendt, og under 1% blev anvendt til sammenligning. (B) Fordeling af synonyme, missense, nonsens og mutationer påvirker starte eller stoppe codon er vist i forhold til alle somatiske mutationer. (C) BMPR1A mutationer p.W487R og p.E502G er placeret på proteinkinase domæne BMPR1A. Henvisning aminosyrer er grønt, er de muterede former vist med rødt. Netto struktur på venstre nedre side indikerer ATP-bindende domæne. (D) BMPR1A mutationer viser nedsat signalering acitivity. Aktivitet af wt mBMPR1A, mBMPR1A E502G og mBMPR1A W487R blev bestemt i C2C12 celler ved hjælp af en SMAD-responsiv luciferasereportergen assay. Induceret Luciferaseaktivitet blev normaliseret til Renilla acitivty. Aktiviteten af utransficerede celler blev sat til 0%, og aktiviteten af wt mBmpr1a blev sat til 100%. Signifikante forskelle blev beregnet med en to-halet t-test og mærket som:. * P ≤ 0,05, ** p≤0.01, *** p≤0.001
MSI tarmkræft havnen op til 8 fold mere kodning somatiske mutationer end MSS kræftformer
De præsenterede hidtil analyser er baseret på 454 hele exome sekventeringer af en kolorektal cancer patient for hver mikrosatellit status. For yderligere at bekræfte at den øgede mængde af kodende mutationer i MSI kræftformer kan generaliseres og ikke skyldes den anvendte teknologi ( »matrix« berigelse og 454 sekventering) vi sekventeret de exomes af fire yderligere colorektale cancere, hver med matchende normalt væv. Denne gang brugte vi ‘i opløsning hybridisering’ til optagelse af DNA efterfulgt af fast sekventering. Efter de samme filtrering fremgangsmåder som beskrevet for de første to patienter, vi igen bestemt op til 8 gange højere mutationsrater for MSI colorektal cancer end for MSS cancere (tabel 3). I den forbindelse fandt vi 532 ikke-synonyme somatiske SNVs i ekstra MSI CRC, og kun 65, 74 og 76 i de tre MSS CRC sager. Således forskellene i mutationsrater er reproducerbare og uafhængige af sekventering teknologi, der anvendes.
Diskussion
Brug næste generation sekventering, vi sekventeret de exomes af MSS og MSI kolon kræftpatienter med gennemsnitlige dækningsområder på ca. 20 gange. Vi anvendte en tosidet klassificering algoritme til at afdække funktionelt relevante mutationer. Ved hjælp af denne metode, vi demonstrerer for første gang, at en matrix-capture NGS et-trins arbejde flow er et kraftfuldt værktøj til dyb karakterisering af solide tumorer og vise, at MSI tumorer bære otte gange mere funktionelle relevante mutationer end MSS tumorer (figur 2) .
den funktionelle virkning af de somatiske variationer blev forudsagt ved hjælp af to funktionelle forudsigelse algoritmer, Polyphen og MutationTaster, og vi fandt 359 somatiske mutationer til MSI og 45 for MSS kræft, der er meget tilbøjelige til at forårsage funktionel svækkelse [ ,,,0],22], [23]. Den heterogenitet af muterede gener tyder på, at ikke et specifikt gen
per se
men det påvirkede vej spiller en stor rolle for tumor udvikling. I den forbindelse finder vi en signifikant berigelse af mutationer i cancer-relaterede veje såsom kræft, cellulære udvikling og DNA-replikation, rekombination og reparation (tabel S5). Interessant nok finder vi 50% af de væsentligste berigede veje i MSS kræft også som væsentligt beriget veje for MSI kræft, hvilket indikerer, at selv om MSI cancere harbor et øget antal af mutationer begge kræftformer kan udvikle gennem overlappende patomekanismer.
Historisk mikrosatellit test i kolorektale cancere var den første prædiktiv test til identifikation af et underliggende mismatch repair (MMR) mutation. Da mere end 90% af arvelige ikke-polypose tarmkræft (HNPCC) viser MSI har mikrosatellit status blevet en almindelig diagnostisk markør for MMR. Desuden har overlevelse fordele og terapeutiske konsekvenser er rapporteret for patienter med MSI tumorer [5], [24]. Brug af ekstremt dybe sekventering af en konserveret region, UCR41, de Grassi og kolleger viser, at denne region har højere mutationsrater i HNPCC prøver end hos raske kontroller og foreslå, at dette kan blive anvendt som følsom molekylær analyse af genomisk ustabilitet [24]. Vi har udvidet deres analyser til hele exomes og fundet 8-fold forskel i antallet af somatisk mutation af MSI og MSS kolorektal kræft. Til sammenligning en undersøgelse foretaget af Greenman
et al.
Som rapporteret på sekventering af 518 proteinkinasegenerne i 210 forskellige menneskelige kræftformer fundet en cirka 25 gange højere mutation sats for MMR-mangelfulde kræftformer [9]. Men disse er ekstrapolationer, og i modsætning til vores undersøgelse, de omfattede tumorer fra forskellige oprindelser og undersøgt alle somatiske mutationer uanset deres funktionelle relevans. Med vores sekventering tilgang opdaget vi også en somatisk
MLH3
mutation i MSI tumor, der, selv om
MLH3
mutationer ikke hører til de klassiske MMR mutationer i CRC, kunne bidrage til mikrosatellit ustabilitet fænotype [25]. Endvidere kombinationen af MSI og
BRAF
mutation, som påvist for MSI tumor beskrevne, som hyppigst ses for CpG island methylering fænotype 1 (CIMP1) tumorer, der er forbundet med
MLH1
promotor methyleringer [21], [26]. Promotor methylering på sin side er forbundet med gendæmpning mekanismer, der er tankevækkende som forklaring på MSI status af tumorerne. På den anden side er det blevet foreslået, at kromosomal ustabilitet (CIN) og CIMP repræsenterer to uafhængige og omvendt relateret mekanismer ustabilitet [27]. CIMP-negative tilfælde er forbundet med p53 (71%) og
KRAS Hotel (33%) mutationer, men er sjældent fundet med
BRAF
(2%) mutationer. Da vi fandt store kopi nummer variationer samt
KRAS
TP53
mutationer i MSS tumor analyseret dette tumor er mest sandsynligt CIMP-negativ [5], [24].
sekventering og analyse strategi, vi har præsenteret kunne være grundlag for fremtidige værktøjer klassificeringskriterierne for tarmkræft, fordi det kan give en parallel påvisning af en øget mutationsfrekvens i MSI tumorer samt påvisning af den underliggende MMR defekt. Desuden kunne vi påvise mutationer af gener ofte er forbundet med visse undertyper af tarmkræft såsom
BRAF, KRAS
TP53
. Inden vores højt prioriterede gener, omfatter alle gener, der passerer alle valg filtre,
BMPR1A
skiller sig ud som muteret i begge tilfælde. Den overordnede struktur viser, at de muterede aminosyrer er alle placeret i den C-terminale intracellulære helix bundt på proteinniveau kinasedomænet og foreslår, at protein-protein-interaktioner er ødelagt [28]. Kimcellelinje
BMPR1A
mutationer prædisponere på ungdomskriminalitet polypose syndrom; dog vores resultater viser, at også somatiske mutationer kan spille en vigtig rolle i sporadisk kolorektal cancerudvikling [29], [30], [31], [32], [33].
Udover disse mutationer vi har også identificeret flere muterede cancer drug mål eller gener, der er forbundet med udfaldet behandling, herunder
BRAF, KRAS, FGFR2
mTOR
, som kan hjælpe med at vælge de optimale lægemiddelkombinationer. Som sådan lignende målrettede re-sekventering tilgange og bioinformatik filtrering strategier kan blive en gold standard for individuelt tilpasset kolorektal cancer behandling i fremtiden.
Materialer og metoder
Etik Statement
undersøgelsen er blevet godkendt af Etisk Komité Medical University of Graz. For nye prøver patienter har givet deres skriftligt informeret samtykke. For gamle prøver (15 år) ikke informeret samtykke forelå derfor alle prøver og medicinske data, der anvendes i denne undersøgelse er blevet uigenkaldeligt anonymiseret.
Case præsentation og vævsprøven samling
Patient 1 havde en høj kvalitet (G3) adenocarcinom i den proksimale colon, iscenesat pT-3C, pN-0, pM-X, PR-0, mikrosatellit ustabilt (figur 1A). Endvidere var dette tilfælde udvalgt på baggrund af kromosomale stabilitet, som bestemt ved anvendelse genom-dækkende næste generation sequencing (NGS) (figur 1B). Patient 2 havde en høj kvalitet (G3) adenocarcinom i den proksimale colon, iscenesat pT-4B PN-2, PM-X, mikrosatellit stabil.
Humant væv opnået under operation var lynfrosset i flydende nitrogen . Kryosektioner (3 um tyk) blev fremstillet og farvet med hæmatoxylin og eosin for at evaluere tumor celleindhold. Dissektioner blev udført under mikroskop for at opnå en tumorcelle indhold 80%. DNA-isolering blev udført under anvendelse af QIAamp DNA Mini Kit (Qiagen) ifølge producentens instruktioner.
Whole Exome DNA Berigelse og Genome Sequencer FLX sekventering
Genomisk DNA fra begge væv blev underkastet hele exome sekvens capture hjælp Roche /NimbleGen s 2.1M Menneskelig Exome Array. Denne matrix er baseret på build 36.3 af det humane genom-sekvens, og indfanger de kodende regioner af 16,755 NCBI RefSeq gener (ca. 180.000 kodende exoner) samt 493 miRNA regioner. Tumor og normalt væv DNA blev underkastet hele exome sekvens opfange ifølge fabrikantens protokol. DNA blev klippet ved forstøvning at fragmentere størrelser under 800 bp, renset (Zymo Research) og end-poleret ved anvendelse af T4 DNA-polymerase og T4-polynukleotidkinase. Linker adaptere pSel3 (5 ‘- CTCGAG AAT TCT GGA TCC TC – 3’) og pSel4-P (5 ‘- Phos /GAG GAT CCA GAA TTC TCG AGT T – 3’) blev ligeret og størrelse selektion blev udført ved anvendelse AMPure DNA Purification perler (Agencourt). Kvalitet blev styret med Bioanalyzer systemet. LM-PCR blev udført med LMPCR3 primere (5 ‘- CUC GAG AAU UCU GGA UCC UC – 3’), før biblioteket blev anvendt til hybridisering ved 42 ° C i 72 timer. Opstillingerne blev vasket to gange ved 47,5 ° C, to gange ved stuetemperatur og to gange ved 42 ° C med vaskebuffere som anbefalet. Bundet genomisk DNA blev elueret med 125 mM NaOH i 10 minutter ved stuetemperatur og amplificeret ved LM-PCR under anvendelse af primere LMPCR3. Captured forstærkede prøver blev udsat for kvantitativ PCR for at måle den relative berigelse.
beriget NimbleGen DNA blev anvendt til at konstruere enkeltstrenget Genome Sequencer FLX (454 /Roche) biblioteker. Efter emulsions- PCR’er sekventeringsprimere blev annealet til templaten og perler blev inkuberet med Bst DNA-polymerase, apyrase, og enkeltstrenget bindingsprotein. Pyrosekventering blev udført på en 70 x 75 mm picotiter plade i 13 forskellige sekventering kørsler. Efter standard rå databehandling blev en resekventering trimning filter anvendes til at øge dataudgang. (Parametre anvendt: doValleyFilterTrimBack = false, vfBadFlowThreshold = 6, vfLastFlowToTest = 168, errorQscoreWindowTrim = 0,01)
For sekventering vi udførte 13 Genome Sequencer FLX kører, der produceret over 558 millioner baser og 1.430.000 læser pr løb. . Læser blev justeret til den menneskelige henvisning genom, NCBI bygge 36 (https://hgdownload.cse.ucsc.edu/goldenPath/hg18/), ved hjælp af GS reference Mapper Version 2.0.0.12 (Roche). De bedste kampe i genomet blev brugt som hjemsted for den læser med flere kampe. Kun unikke læser med en længde på mindst 50 bp, blev anvendt til yderligere analyse (se køre statistik Tab. 2).
Påvisning af varianter blev udført med GS reference Mapper Version 2.0.0.12 (Roche). Redundant læser blev trukket før variant kaldelser. Kun HCDiff (høj tillid forskelle) i GS Mapper software blev brugt som udgangspunkt i variant afsløring [20]. HCDiff kaldelser formoder mindst tre læser med varianten med både fremad og baglæns læser inkluderet; alternativt kvalitetskravene score ved de variable positioner skal være over 20 (eller over 30, hvis en homopolymer af fem eller flere baser er involveret). Som yderligere kvalitetskriterier vi brugte kun varianter med en dækning . 10 × af høj kvalitet læser
Whole Exome ‘i opløsning “DNA Berigelse og solid sekventering
berigelser og solid bibliotek forberedelse blev udført ifølge Agilents SureSelect Target Berigelse protokol for Applied Biosystems solidt system. Kort fortalt blev hele genomisk DNA klippes og ende repareret. For adapter ligationer blev brugt 30x over adapterne. Størrelse markeringer for 150-200 bp DNA-fragmenter blev udført efterfulgt af et nick-translation og amplifikationstrin med Platinum polymerase (Invitrogen) og Pfu-polymerase (Fermentas). For hybrid valg bibliotekerne blev justeret til 500 ng i 3,4 pi volumen og tilsat til SureSelect Block løsninger. Hybridiseringer blev udført i 24 timer ved 65 ° C blev hybrider ekstraheret med 500 ng M-280 streptavidin Dynabeads (Invitrogen) og endelig elueret med 50 pi Elution buffer. Efter amplifikation med Platinum polymerase bibliotekerne blev kvantificeret ved qPCR og DNA-koncentrationen blev titreret for at opnå en fraktion på 10-20% monoklonalt skabelon perler i emulsionen PCR under anvendelse i alt 0,7 til 1 milliard perler. Successiv perle berigelse og aflejring af 130 millioner perler pr kvartal slide (quad) blev efterfulgt af standard 50 bp fragment kørsler. Hver af de fire patientprøver blev analyseret på en enkelt quad
Kortlægning udførtes med Bioscope alignment rørledning under anvendelse frøet udvide algoritme med et misforhold straf score -2,0. Enkelt nukleotid Varianter (SNV) blev kaldt med DiBayes algoritme integreret i Bioscope pakken.
enkelt nukleotid variant (SNV) påvisning
Tissue materialer blev genotypebestemt på Affymetrix 6.0 array, ifølge producentens protokol. Array positioner med en kvalitet score (p-værdi) 0,1 blev anvendt til sammenligning med sekventering data. Sekventeringsdata positioner blev anvendt, hvis deres dækning oversteg 3-fold. Dette genererede 46.000 og 49.000 positioner for tumor og godartet væv, henholdsvis som var berettiget til sammenligning. For at bestemme falsk positive og falsk negative, vi sat array data som standard og skelnede mellem henvisning opkald og SNP opkald afhængighed array data.
Til påvisning af somatiske varianter, en bimodal strategi blev anvendt med tumor varianter kaldet under strenge kriterier, mens varianter i kontrol væv blev kaldt bruger mindre strenge kriterier: en minimumsgrænse for læser blev sat med varianter af 15% af alle læser på en given position i tumor. Mindre strenge kriterier blev anvendt til at kalde kontrol væv varianter med mindst en variant læse og en dækning cutoff på 5. minimum For dækningsområder over 30 gange en variant læse blev accepteret.
Kapillær Sequencing
Opfølgning bekræftelse af identificerede SNVs blev udført på en ABI 3730 (Applied Biosystems) kapillær sekventering instrument efter standardprocedurer.
Bestemmelse af Copy nummer variationer
Udarbejdelse af enkelt læser biblioteker og sekventering var udført under anvendelse af Solexa sekventering platform (GenomeAnalyzer IIx, Illumina) ifølge producentens instruktioner. Billedanalyse og base kald blev udført ved hjælp Firecrest 1.9.5_14 og Bustard 1.9.5_14 og læser blev justeret til det humane genom (NCBI36) ved hjælp Bowtie 0.9.7.1 [34]. Kopiér nummer analyse blev udført i R ved hjælp af DNAcopy pakke [35]. Kort sagt, DNA læse frekvenser blev bestemt for placeringer af 50 Kb. Den log2 frekvensforhold af tilsvarende placeringer blev beregnet for tumor versus normalt væv. Median af nøgletal var centreret til nul eksperiment klogt. Log forhold blev udglattet ved DNAcopy med standardværdier og eksemplarnummer variation påvistes ved DNAcopy anvendelse af en tærskel på to standardafvigelser.
Genotypning på Affymetrix 6.0 arrayet blev udført ifølge producentens protokol. Regioner i kopi nummer gevinst og tab blev bestemt ved parrede og analyse ved hjælp af skjulte Markov Model (HMM) i Partek Genomics Suite-software (Partek Inc, St.Louis, MO) med standard parameterindstillinger. For parrede analyse blev kopital værdier fra sammenlignende tumor og godartede væv profiler fra den samme patient.
Bioinformatik arbejdsproces
I hvert væv blev variationer kommenteret under anvendelse af gen-modeller genereret af Ensembl ( Ensembl 54,36, www.ensembl.org). Alle variationer blev kortlagt til alle udskrift modeller, hvilket førte til flere anmærkninger for flere loci. For eksempel kan en variant føre til en aminosyreændring i én transkript og vises i UTR af en anden.
Leave a Reply
Du skal være logget ind for at skrive en kommentar.